こんにちは、にょろりんこの技術備忘録ブログです。 今回は、前回の「MythoMaxでキャッチコピー生成」編で得られた日本語タイトルを、さらに検索性の高い語句に分解していく第3ステップ──「形態素解析」編です。 今日の私は言語学者です。 AIが画像から文章をつくる(BLIP) 英語キャプションを日本語に翻訳(MythoMax) 形態素解析で語句を抽出(SudachiPy)←今回のテーマ1 フィルタ&整形して、検索タグとして格納←今回のテーマ2 ティアラ_手を振る タイトルは自然でも、「そのまま検索語」には向かない MythoMaxで得られる出力は、たしかに自然な日本語の一文です。 しかし、たとえ…