Hatena::ブログ(Diary)

5.1さらうどん Twitter

2009/11/20(Fri)

形態素解析で『ボジョレー・キャッチコピーメーカー』作ってみた

| 18:22 |

ボジョレー・ヌーヴォー 毎年「今年は最高!」の怪 - Ameba News

求むボージョレ・ヌーヴォーのはずれ年 - タケルンバ卿日記

ボジョレーの評価が毎年、少年漫画並にパワーインフレを起こしているよねー、というお話を聞いてしこたま笑ってた。


95年「ここ数年で一番出来が良い」

96年「10年に1度の逸品」

97年「1976年以来の品質」

98年「10年に1度の当たり年」

99年「品質は昨年より良い」

00年「出来は上々で申し分の無い仕上がり」

01年「ここ10年で最高」

02年「過去10年で最高と言われた01年を上回る出来栄え」「1995年以来の出来」

03年「100年に1度の出来」「近年にない良い出来」

04年「香りが強く中々の出来栄え」

05年「ここ数年で最高」

06年「昨年同様良い出来栄え」

07年「柔らかく果実味が豊かで上質な味わい」

08年「豊かな果実味と程よい酸味が調和した味」

09年「50年に1度の出来栄え」

毎年、毎年賛辞が並べられていて、全部併せたら凄いことになるんじゃないかな—、などと考えていたのでした。


というわけで、この15年分のデータを取り込んで、形態素解析して、マルコフ連鎖で「ボジョレーのキャッチコピー生成機」を作ってみた。

ボジョレー・キャッチコピーメーカー


http://gyazo.com/f16192d1c36f2662c75574dc9ac94724.png

http://gyazo.com/63acd88a3a509028259743428176b252.png

http://gyazo.com/d1884eeb43556d6204a8c481dbc3f39f.png

このような味わい深いコピーが生成されます。

技術的なお話

マルコフ連鎖で文章生成(JavaScript) - エブログのソースをほぼそのまんまコピーさせて頂いただけです。

こちらのソースは、文字入力させて、任意の文字列に対して形態素解析を行えるスクリプトなので、ボジョレー向けにチューンナップできれば、もっと精度は良くなったんじゃないかなあ・・・。

Yahooの形態素解析APIなどを用いて、自分で一から作るという事も考えたのですが、この手の話題はワインだけに旬が命なので、結局このまま使用しました。

Yahoo!デベロッパーネットワーク - テキスト解析 - 日本語形態素解析



来年以降、キャッチコピーを考案される方はどうぞご利用ください。

夏馬夏馬 2009/11/20 19:40 文意をそのままとると、凄い事になりますな。
05年が「ここ数年で最高」で、03年が「100年に1度の出来」なのだから05年のワインは100年に一度を越える味なのでしょうw
今年のワインは95年比で何年に一度の出来なのでしょうか?

gigi-netgigi-net 2009/11/21 02:10 次の各証言を読み、もっとも美味しいとされる年を答えよ(2点)