2009/11/20(Fri)
形態素解析で『ボジョレー・キャッチコピーメーカー』作ってみた
JavaScript, Neta, Program | |
ボジョレー・ヌーヴォー 毎年「今年は最高!」の怪 - Ameba News
ボジョレーの評価が毎年、少年漫画並にパワーインフレを起こしているよねー、というお話を聞いてしこたま笑ってた。
95年「ここ数年で一番出来が良い」
96年「10年に1度の逸品」
97年「1976年以来の品質」
98年「10年に1度の当たり年」
99年「品質は昨年より良い」
00年「出来は上々で申し分の無い仕上がり」
01年「ここ10年で最高」
02年「過去10年で最高と言われた01年を上回る出来栄え」「1995年以来の出来」
03年「100年に1度の出来」「近年にない良い出来」
04年「香りが強く中々の出来栄え」
05年「ここ数年で最高」
06年「昨年同様良い出来栄え」
07年「柔らかく果実味が豊かで上質な味わい」
08年「豊かな果実味と程よい酸味が調和した味」
09年「50年に1度の出来栄え」
毎年、毎年賛辞が並べられていて、全部併せたら凄いことになるんじゃないかな—、などと考えていたのでした。
というわけで、この15年分のデータを取り込んで、形態素解析して、マルコフ連鎖で「ボジョレーのキャッチコピー生成機」を作ってみた。
このような味わい深いコピーが生成されます。
技術的なお話
マルコフ連鎖で文章生成(JavaScript) - エブログのソースをほぼそのまんまコピーさせて頂いただけです。
こちらのソースは、文字入力させて、任意の文字列に対して形態素解析を行えるスクリプトなので、ボジョレー向けにチューンナップできれば、もっと精度は良くなったんじゃないかなあ・・・。
Yahooの形態素解析APIなどを用いて、自分で一から作るという事も考えたのですが、この手の話題はワインだけに旬が命なので、結局このまま使用しました。
Yahoo!デベロッパーネットワーク - テキスト解析 - 日本語形態素解析
来年以降、キャッチコピーを考案される方はどうぞご利用ください。




05年が「ここ数年で最高」で、03年が「100年に1度の出来」なのだから05年のワインは100年に一度を越える味なのでしょうw
今年のワインは95年比で何年に一度の出来なのでしょうか?