Hatena::ブログ(Diary)

いろいろ作りたい

2011-12-28

Twitter感情分析サービスを作ってみた 〜一般意志2.0モジュールの実装〜

Twitterのタイムラインやキーワードに対して、肯定・否定の印象を分析するWEBサービスAPIを作ってみた。

Twitter感情分析所


たとえば「任天堂」というキーワードを入力すると、下のような感じに、どのくらい肯定と否定の発言をしているかがわかる。

f:id:gen256:20111228030629p:image

ユーザのタイムラインも分析できる。

下はベッキー @

の分析例。

f:id:gen256:20111228030630p:image

自分のtwitterアカウントを分析すれば、自分の発言がどのくらい否定的な印象を放っているかが数値的にわかると思う。


一般意志2.0への利用

ところで最近、東浩紀という人が「一般意志2.0」という著書の中で、現代の行き詰まった民主主義を変える新たな統治方法のアイデアを提言した。それによれば、世の中が多様・複雑になりすぎて、今の熟議型民主主義ではもうどうにもならんところがあるから、みんなの意志(無意識的に表れる人々の意志)を参照しましょう、みたいなことを言っている。(書評政府の審議会を、ニコ動で放映せよ・・・という、東浩紀さんの「一般意志2.0」を読んで(前編)

その「無意識的に表れる人々の意志」っていうのが、昔は取得困難だったんだけど、今はネットに蓄積された大量のデータからその無意識をすくい取ることができ始めている。たとえば、Twitterとかニコ生のコメントとかで。

で、実際に無意識をすくえるのか、を試してみた。

下のグラフは、「原発」を含むTweetに関する肯定率の推移を示したもの。

f:id:gen256:20111228030631p:image

3.11の地震の引き起こしたあの原発事故のためか、2011年3月にがくっと肯定率が落ちている。

そして、次第に人々が安心を取り戻し、さらには「思ったより危険じゃないんじゃね?」的なムードのためか、数値は回復の傾向を見せている。

もちろん、この分析だけで一般意志をすくったとは言えないだろうけど、一つの指標やモジュールとしてはありなんじゃないかと。


人工無能への応用

相手の発言の肯定・否定が正しく読み取ることができれば、これを我が人工無能鳥元モズク」の自然な対話の実現にも応用したい。

でも、どういう形で組み込むべきかがいまいち見えてこない。

ただ、Twitter本社が持つ全Tweetの超巨大なデータがあれば面白いことができる。


データがあまりにも巨大になると、それを人間一生分に匹敵するくらいの「経験」としてAIに与えることができる。

「腹減った・・・」

ラーメン食べた。おいしー」

「おなかいっぱい(*^^*)」

「眠くなった」

Twitterではこのくらい細かいレベルの記録がたくさん書かれる。

こうした記録の集合から、例えば、

「腹が減る」→「食べ物を食べる」

みたいな規則や因果関係、行動パターンを見つけ出せる。つまり経験に関する常識が得られる。

とはいえ、やはりそこに書かれることは、感覚器官の受ける情報や物理レベルの現象のほとんどを省いたものだから、その「言語だけ」の世界でできあがるAIは、感覚や物理的な実質的概念を持たない、記号だけを認知する生き物になる。

「テーブルの上にあるリンゴを見ている、なう」

「ちなみにそのリンゴは赤くて丸くて、美味しそう、なう」

「唾液ができてきた、なう」

「りんごを食べようと思ってリンゴに手をさしのべてリンゴを手につかんだ、なう」

このくらいに詳細に書いてくれなければ感覚・物理レベルの情報は蓄積されない。(そういう意味でSFの順序を考えると、「仮想世界・電脳世界の実現」→「感覚を理解するAIの実現」)

ただ、今回実装した肯定・否定性を読み取る能力は、人間にとってかなり基礎的な感覚モジュールである「快と不快」をトップダウン的とはいえ、AIに与えたことになる。

この基礎的な感覚を持った状態で、Twitterの全データの海を泳がせると、いつかすごい泳ぎ方を学習できるかもしれない。

物理レベル・五感レベルの感覚は無理かもしれないけれど、言語レベルだけで完結する感覚ならば、人間と同等くらいの感覚を与えることができるのかもしれない。

例えば、誰かが「おやすみ」と言ったときに、それに「おやすみ」と返答してあげることは相手が喜ぶのだ、という経験をあの巨大な経験集合から嫌というほど経験するだろう。この時、AIは「おやすみ」を返されることが「快」であることを感覚的に理解したと言っていいんじゃないかと思う。

あるいは、それだけでは不十分かもしれない。リアルの世界での快とTwitterの対話での快はまた別物だから、ちゃんと言語コミュニケーションでの快を体得させる必要もありそう。

誰にも相手にされない(リプライをもらえない)ような状態を「死・不快」、肯定的なリプライを「報酬・快」と設定し、それが最大化するように、強化学習とかGAを使ってあの巨大な経験データベースを自由に徘徊させる。すると、リアルな「コミュニケーション欲」を持ったAIが誕生するのかもしれない。

2011-11-05

ニコニコ動画のコメントの年齢分析したら中学生がほとんどだった件

要約というか言いたいこと

  • 調べてみると、ニコ動のコメントは10代によるものがほとんどだった(特に中学生)。
  • コメントの空気は彼ら小中学生が作っているんじゃないのか。
  • 価値観がかなり違うんなら分けた方がいいんでないか。

最近のニコ動コメントと空気

最近ニコ動のコメントを見ていて、なんとなくコメントがつまんないなあと思う。

喧嘩のコメントは論外だけど、普通のコメントでも

「うーん・・・そこでウける?」

「この曲そんなにいいかなあ・・・」

みたいに、「みんな」との感覚のズレが昔に比べると目立つようになってきたように思う。


どうやら自分はニコ動内での標準的な価値観のラインから逸脱してしまったのか。

だとしたら、その「標準的な価値観」とは誰がどのように作りだすのか?


実際そこにいる人と表面上そこにいる人の違い

普通に考えると、その「標準的な価値観」は、その場にいる人間の平均的なものになるはず。

100人いて、演歌が好きな60歳代が大半を占めるなら、その空間ではJポップやロックよりも演歌が好まれる空気になって当然。

ニコ動ユーザの年齢構成は、10代が20%、20代が45%、30代が20%、40歳以上が10%(2011年3月時点)。

なので、圧倒的に多い20代がニコ動の空気の中心となるはず。


しかし、そうはならなかった。

動画でコメントをしているユーザの年齢を分析してみると、驚いたことに、80%近くを10代が占めていた(2011年のコメント)。


↓実際の年齢構成(公式データ)

f:id:gen256:20111105175307p:image


↓コメントでの年齢構成(N=37105)

f:id:gen256:20111105175308p:image


↓コメントでの年齢構成の推移(N=526623)

f:id:gen256:20111105175309p:image

10代は時間がたくさんあることから発言数が多くなるのか、それとも、もともと積極的なのか。


↓コメントでの年齢構成の 7〜22歳までの内訳 2011年(N=30805)

 中学生が最も多い。次いで小学生もがんばってる。

f:id:gen256:20111105200105p:image


↓「VOCALOID」タグで2011年に投稿されたコメントを調べてみた結果(N=971)

f:id:gen256:20111105175312p:image


↓「VOCALOID」タグで2011年に投稿されたコメントを調べてみた結果(7〜22歳までの内訳)(N=834)

f:id:gen256:20111105175311p:image


↓「政治」タグだとこうなってる。さすが小中学生も政治には閉口ということか。(N=125)

f:id:gen256:20111105175313p:image



重要なのは、「実際の存在率(実際の年齢構成)」は視聴者には全く伝わらないこと。

そんなものは視聴者には見えない。画面を通して見えるのはコメントだけ。

しかも、そのコメントから伝わるのは相手の素性がほとんど抜き取られた空気(雰囲気)だけ。

実際、「wwwwwwwww」や「wktk」を見ても、そのユーザの年齢や性別はまったく分からない。

そこから伝わるのは、「みんな」が笑ったりドキドキしているという空気。


相手が何者か分からないからこそ、彼らを自分とそう違わない人物として認識できる。

相手が小学生であっても、おばさんであっても、みんな「お前らw」的な存在(なんとなく近い存在)になり得る。

でも、最近は「お前らw」的ではなくなってしまった。


それにはたぶん価値観の差が原因にある気がする。


10代と他の世代との価値観の差

具体的に10代と他の世代との価値観の差にはどのようなものが考えられるか

  • 音楽における世代間の感性の差
  • コンテクスト重視かコンテンツ重視か
  • エロ重視

音楽における世代間の感覚差

音楽の嗜好性に関しては世代間でどうしても超えられない感覚差がある。

老人は演歌ばかり好んで若者に演歌が理解できないのもそれ。

時代や環境に左右されない普遍的な音楽的感性があるなら、ロックやポップスがもっと老人にも支持されなければ不自然。

また、音楽は視聴の蓄積によって嗜好が変化する。実際、小学生の頃からジャズを好む人は少ない。

歌詞の内容をとっても、世代ごとに、環境差の影響で好まれるものが変わっても不思議ではない。


つながりやコンテクスト重視世代とコンテンツ重視世代

正直、上の音楽の嗜好性の話はまだいい。

一番問題なのが、そもそも「何のためにニコ動を利用しているのか」というレベルの価値観の差。

そのひとつの例が、「最近の動画コメントについて思うこと」という動画に見られる。

http://www.nicovideo.jp/watch/sm13604690

http://dic.nicovideo.jp/v/sm13596935

ニコニコ動画で「最近の動画コメントについて思うこと」という動画が人気 なあお前らどう思う?

動画の要点を一行でまとめると、

「否定コメを否定するコメントやめろ。肯定コメしかなくなる」

内容や本質的な部分よりも人とのつながりを重視する人や煽てるのが好きな人にとっては、否定的・批判的なコメントはウザい。一方、内容や本質的な部分を重視する人は、正直な空気・正直なコメントを求める。「仲良く」みたいなことはは全く考えていない。

まあ、この違いが本当に世代間に強く表れるのかどうかは十分な検証が必要だけど。



価値観の差(≒年代の差)がコメントとしてどのように表れるか

価値観の差は、極端で目立つものから、目立ちはしないが量的には多い潜在的なレベルのものまで、いろいろある。


極端で目立つもの:

・繋がり重視系:挙手厨、「○○見てる〜?」

・論争:「あぁ? 」「↓お前は〜」

・強い自己主張系:「○歳だけど〜」、「俺は〜」、赤字


潜在的なもの:

・評価:賞賛、ブーイング、「www」「最高!」「GJ」「微妙」「つまらん」

・感情表現:笑い、泣き、など

ちなみに挙手厨の年齢構成も7割が10代と、若い人ほど多い。

論争(論争というかスルースキルの欠如、または異常な愛)の年齢構成に関しては、「↓」から始まってかつ「画面下表示」で投稿されたコメント郡を誰かに対する論争的ツッコミであると仮定して集計した。

その結果も10代が66%と最も多かった。


極端で目立つタイプのものに関してはわかりやすいので、逆に自分は気にならない。

というか、気にしない。見た瞬間に「お前らw」的でないことが認識できるので、スルーすればいい。


問題なのは、潜在的なもの。

これらは見た目上が「お前らw」的で、区別がつかない。



グラフを見ると、10代のコメントでの存在感(特に中学生によるもの)が増しているわけだが、

これは言い換えると、中学生の持っている価値観がコメントを通して動画の盛り上がりやブーイングを支配するということ。

そうすると当然、中学生の好みの動画が上がる。

それを見たクリエイターが方向性をそっちに変えたりすると、もう全体がそっちに向かっていく。



そこで年齢フィルター機能

つい最近NGコメント共有機能が実装されて運営GJとか思ったけど、あれで防げるのは極端なものだけ。

問題なのは、そういった表層には目立って現れることのない価値観や嗜好性の違い。


カテゴリという機能はその違いを分けてノイズを減らす役割がある。

ボカロが嫌いな人はボカロのカテゴリに行かないことで、視界からボカロを排除できる。


もし、年齢と価値観との間に強い相関があるなら、カテゴリと同じように、コメントにおいても年齢ごとに仕切りを作ってみてもいいんじゃないかと。

というわけで、今度試しに、年齢フィルターを作ってみて、各年代のコメントを流して動画を見たときの感触を比較してみようと思う。


統計について:ユーザページのプロフィール公開率が各年代で同一であるという仮定を置いています。

補足 統計値について

・Nの追加

補足 調査方法

・1000以上のコメントのついた動画からそれぞれコメントを1000個ずつとる

・それらの内の184でないコメントについて、そのユーザの生年月日を取得して収集

補足 プロフィール公開率について

運営が教えてくれれば一発ですが。

調べる方法もあるようですが、今のところ推測するしかありません。

プロフィール公開率についての意見や感触。

@

ニコ動の動画ランキングで、120作品を毎日眺めててもクリックしてみようと思う作品が最近は2,3個しかなくなってしまったのは、コメントを入れる年代がほとんど中学生ということでなんか凄く納得しました。よって年代別ランキングモードが欲しいです。 @koizuka @hedachi

@

なので htn.to/zuMaLG で一部の動画のコメントからユーザーが特定できかつ生年月日が公開されてるのだけから数字だしてても,サンプル少なすぎるんじゃ? というのが正直な感想>生年月日を公開してるユーザーなんて,うp主のうちの1%くらいしかいない

Memeo

実際ボカロ等の動画のコメント見てると「子供が多いんだろうなあ」と思うことが多いのでコメント無しで見ることが多い。

kaz_hiramatsu

ボカロのコメは、納得。

inumash

統計の取り方にもよるが、“皮膚感覚”としてはなんとなく整合性がとれてるような気も。ただ見る動画で全然違うけどね。サッカー関連とか洋楽とかは多分おっさんばっか。

sekiyado

統計のとり方に穴がありすぎる気が…。とは言え、やっぱり中高生くらいが一番多いような気はする

lisa-rec

アメーバうごメモもだけど、若いほどコメントも多いし、☆連打するね。

FTTH

低年齢の方がプロフ全公開に抵抗を感じないバイアス がある可能性

イメージ通り!? 2chは高齢化、ニコ動は“リア厨”

2011-09-12

東方や初音ミクの文化的持続可能性 / ニコ生思想地図「『おもしろい』をセカイに広めるには」東浩紀×川上量生

ニコ生思想地図「『おもしろい』をセカイに広めるには」東浩紀×川上量生」(ニコ動)(概要)を見て思ったこととか自分なりの解釈のまとめ。

とにかく自分の興味は、初音ミクや東方の盛り上がりがなぜ起きたのかという点にあるので、前半の文化の持続可能性の話は大変興味深かった。

東さんはきっぱりと、今のようなハイコンテクストな状態が続くと、そのうちオタク文化は滅びるだろうと述べた。


「他者を必要とするモチベーション」が初音ミクや東方を膨張させた

消費者とクリエイターの存在自体が、人々の「他者を必要とするモチベーション」を増大させ、それによって生み出された作品や人によってされに人が集まり・・・の連鎖初音ミクや東方の盛り上がりはそういった連鎖の構造によるものではないのか、というふうに自分は解釈した。


説明のためにモチベーションを2つに分類する。

・他者を必要とするモチベーション(ハイコンテクスト的)(二次創作的)(他者と共有された何か)

・他者を必要としないモチベーション(自己の内に閉じているモチベーション)(オリジナル的)

他者を必要とするモチベーションの例:

クリエータ:「初音ミク?まあそれなりに好きだけど・・・。でもやっぱり、人がたくさん見てくれるし、あわよくば歌ってみたとかに発展する可能性もあるから、初音ミクで曲を作ろうかな」

消費者:「実はその曲おれも聴いてるんだよNE!」

自己の内に閉じているモチベーションの例:

クリエータ:「初音ミクにこの歌を歌わせたい。だから俺は初音ミクのためにこの曲を作った。そして彼女に曲を歌ってもらう」

消費者:「初音ミクはなんてキュートなんだ・・・。それにこの歌も感動的だ」


インターネットは「他者を必要とするモチベーション」(ハイコンテクストなもの)を増大させる性質がある。

ネット空間では均質だったはずの人々の視線の磁場を、ある一点に集中できる。リアルな空間で事件が起きても、そっちを振り向くのはせいぜいその場にいる数百人かもしれないが、ネット空間は万単位の巨大な視線を可視化・数値化し、人々にその巨大な視線を意識させる。さらに、本来あちこちに散らばっていた強い文脈(ハイコンテクスト)な領域も、その機能性(ニコ動でいえば、タグやカテゴリ)によって接続され、視線をさらに高密度に寄せ集めることができる。


初音ミクもまた、ニコニコ動画で人々の視線を集めた。

最初から巨大だったわけではなく、まず少数の人に注目された。まずは、初音ミクに比較的純粋な興味を持つファンがつき、比較的純粋な興味による創作が行われた。そこでは「自己の内に閉じているモチベーション」による創作が多く行われたと思われる。実際、昔は今に比べ、初音ミクの内面について歌った曲が比較的多かった。あるいは初音ミクボカロ)である必要性がある曲が多かった。

そこで作られた良作によって初音ミクへの視線はさらに大きくなる。

この激熱な視線を嗅ぎつけて、「他者を必要とするモチベーション」が比較的強い音楽クリエイターは、自然にそこへ流れてゆき、そこで活動をする。まあ、そこまで他人の視線に頼りきったクリエイターは極端な例だけど、これは1か0の話ではなく程度の問題で、もちろん、どんなクリエイターだって「他者を必要とするモチベーション」を一切持たないことはない。多少でも持っているからニコ動に投稿するわけで。

このようにして、初音ミクの登場と同時期に現れた超純粋なファンを中心として、そのファンや彼らが作り出した作品への強い視線というインフラ(モチベーション)をベースにして、さらに二層目のクリエイターや消費者がつく。彼らの動機がどうであれ、作品の総数が増えれば必然的に良作の総数と視線は増える。良作と視線が増えればファンが増える。ファンが増えれば視線が・・・というふうにして、初音ミクへの注目が集まるほど、またさらに三層、四層と雪だるま式に膨らんでゆく。視線が大きければ大きいほど、「他者の視線を必要とする」クリエイターが集まってくるので、膨張の連鎖が起こる。

初音ミクや東方が膨張したのには、他にもいくつかの原因が考えられる。そもそも原作が良いとか、キャラの規定の緩さとか、匿名性だとか、法だとか、いろんな議論がある。

ともかく、こういった「他者を必要とするモチベーション」による連鎖があまりに加熱すると、いつか熱がさめたときに、他者の視線のインフラを頼りに築き上げていたものがボロボロと崩壊するのかもしれない。初音ミクや東方の音楽なんかは、そこまでハイコンテクストにならないのかもしれないが、例えば東方の二次創作小説の、さらにその三次創作で、実はその作品は別の作品のあのキャラがうんたらかんたらで、ともかく俺たちにはそれが分かり合えて、熱くて、濃くて、とても楽しいんだぜ・・・のようにハイパーコンテクストになると、その時はその人達にとっては面白いかもしれないが、それをとりまく文脈や人が消えたときには、東氏が言うように、ほとんどの価値・意味・理解が失われてしまうから、それは長期的に見たときに文化として残りにくい。



こういった現状が問題か問題でないかは、両方メリットとデメリットがあって、しかも(東さんが言ったように)人の嗜好によるので何とも言えない。仮に東さんのように、文化が残されるべきものだとする立場からすると、今の現状は問題に写るのかもしれない。

しかし自分はこれ見て、単純に「各自が好きな方向性でやればいいよ」と言って見過ごせない違和感があって、それが何なのかを考えてみた。



ライトクリエイターの増加と「他者を必要とするモチベーション」の蔓延/それがもたらす全体の動物化

その違和感とはたぶん、「他者を必要とするモチベーション」(ハイコンテクスト)の蔓延が、「大きな物語」や純粋なオリジナルの可能性を打ち消してしまう性質があるからではないかと思う。



ネットや技術の進歩によって誰もがクリエイティブなことに簡単に参加可能になった。

例えば、ニコ動pixivで誰もが気軽に作品を多くの人に見てもらえる機会・チャンスを与えられた。作曲や動画作成においても、昔はプロしか手にできなかった機材やソフトウェアが手頃な価格で手に入るようになった。

こうしたクリエイターの増加・大衆化は、普通に考えると、まあ、素人は素人でやればいいし、すごい人はすごい人でやればいい・・・みたいになると自分は思ってたが、どうやらネットではそうはいかないみたいで、変な形で融合してしまったように見える。


イラスト投稿サイトのpixivを見てみると、初期の頃はオリジナルな絵がたくさんランキングに見られた。しかし、時間が経つと、みんなが知っているような、一般受けの良い二次創作系や共有されたテーマを持ったハイコンテクストな作品があふれだした。

昔は、クリエイターといえば、そこそこガチな人が多くて、「俺は自分の中にあるこれを表現したいんだ」みたいな人、あるいは、そもそもネットが存在しない(コンテクストが存在しない)空間においては、自分が表現したいものをただ表現するしかなかった・・・その真相はどうかは知らないが、少なくとも、近年の気軽に参入したライトなクリエイター達の多くはそこまでヘビーに構えていないだろう。

さらに、ライトクリエイターの多くはそこまでの実力を持っていない。pixivの新着イラストやニコ動の再生数1000に満たない動画の数の比率、などを見れば明らかだが、ネット上に存在する作品(クリエイター)の大部分はいわゆる「底辺」層で満たされている。ランキングに載るような人はごく一部であるということ。

では、実力のない彼らはどうやって自分たちの欲求を満たすのか。

そこで、他者の存在に頼り始める。それにはいくつかの方法がある。例えば、お気に入りユーザに入れ合ったりだとか、コメントをつけ合うだとか、いわゆる「馴れ合い」と呼ばれるものがそのひとつである。馴れ合いという響きはあまりよくないが、現実の人間関係がそうであるように、適度な距離を保てば、お互いモチベーションの維持につながるので健全といえば健全な方法ではある。twitterフォロー返しも似たようなところがあるのかもしれない。極端な例になると、そもそも創作にはあまり興味がなくて、人とのふれあいそれ自体が目的になっている人さえいる。また、共通のテーマ・文脈を共有することも他者の存在に頼る方法のひとつとして有効。極端な例を示すと、「とりあえず東方で作っとけばある程度の人が見てくれるだろう」みたいな。

重要なのは、ネット全体で見たとき、底辺層やライトクリエーターの比率がはるかに多いということ。そして、彼らは自然に他者と結びつき、そのコンテクストを自然に増幅させてゆく。そして大多数の人が作り出す、巨大なコンテクストにその空間が支配されたとき(例えば、pixivが大量の二次創作やひとつの共有されたテーマであふれかえったとき)、「他者を必要としない」絵を書いていたクリエイター(「自己の内に閉じているモチベーション」によってオリジナルを創作していたクリエイター)がどう思い、どのような行動をとったかである。

ひとつ考えられるパターンとして、そのコンテクストの流れに自分自身も参加してしまうということ。東方が嫌いというわけでもない、むしろどちらかという結構好きな方、だけれども、本当は東方よりも描きたいオリジナルの大きな世界観を彼は持っている。けれども、東方を欲している人はすぐそこにたくさんいる。ランキングにも東方がたくさん。東方で描けば多くの人が絶賛してくれる、オリジナルでやるよりは確実に。話にも加われる。今、確実に、利得を得ることができるのは、とりあえず東方。となってしまう。

このようにして、「大きな物語」「自己の内に閉じているモチベーションが生み出す作品」が出てくる可能性を狭めてしまっている気がする。

インターネットやテレビのない時代は、文脈の接続が今ほどできないので、他者を必要とするハイコンテクストなものはあまりなくて、自己の内にある「本当に自分が表現したい何か」に対してもっと真剣に向き合えたのではないか。




ところで仮にこれを問題とする立場から見たとき、こういった問題はアーキテクチャによってある程度は解決できる問題でもある。

すごく単純な話で、pixivの場合だと、ランキングを二次創作とオリジナルに分けるだけでも全然違うと思う。

番組の途中で、モチベーションの定量化の話があったが、こうしたアーキテクチャと人々のモチベーションや行動との関係はすごく気になる。

2011-07-30

公式RTは攻撃性を誘発する危険な機能

昨日のニコ生放送「勝間和代 デキビジ(勝間和代、田原総一朗佐々木俊尚東浩紀)」で主に東さんが言ってたこと。


公式RTは攻撃性を誘発する危険な機能

Twitterに鍵をかけて劇的に変化したよって話。

東:非公式RTは知ってる人間が言ってるのでそこまで批判を言えないが、公式RTは見知らぬアイコンが突然現れて挑発的に見える。

東:Twitterは自分のタイムラインを自分の好みで選ぶので「自分の庭」のような環境。そこに自分たちとは異なる意見が突然入ってくる。

東:複数のツイートからなる意見なんかの一部だけが切り取られてRTされていたので、前後の文脈が参照されない。議論は文脈が大切なので、一部だけ切り取るといくらでも過激に見える。

佐々木:togetterなんかでも、そういった切り取りが起こる。

東:ミニマスコミみたいな。



その他気になったところをいくつかピックアップ。

3.11周りのことをからめつつ日本の行方、みたいな感じのお話だった。


ネットメディアへの失望

佐々木:日本人は対立軸を作ることができていない。未だに勧善懲悪の物語のようなものがある。官僚、大企業、政治家は叩いて良い、その一方に無辜の市民がいるという発想。

勝間:菅さんが悪いと大合唱してもしょうがない。

*:逆に官の側も民を愚民と見ている。官と民の間に大きな壁がある。

東:昭和時代の国民の意識は、政策の優劣を判断するとか高度なことは考えてなくて、「偉いやつが何か言ってるかとりあえず聞いとこう」くらい。それに比べれば平成時代の方がまだ民の意識の方が上がっている。しかし、上がっているが故に混乱を招いているのではないか。

東:昔は、政治家や社長の意見はおとなしく聞いていたが、今は平社員も社長との対等意識みたいなものをもっていて、その極限がtwitterのようなソーシャルメディア。みんなが平等で、お互いに監視でき、民主的な理念が隅々まで行き渡った。しかし、行き渡っただけという印象。

佐々木:アーキテクチャはどうであれ、マスメディアにしろネットメディアにしろ、鏡に過ぎない。ネットメディアの方にも、マスメディアが抱えていた権威主義的な部分とか、批判だけしてりゃ何とかなるだろ的な空気感が、この5年間くらい流れ込んできた。

佐々木:ネットメディアでも何でもそうだが、アーリーアダプター層がちんまりと数百万人くらい集まってやっている最初の内は民主的な雰囲気もあって面白い。しかし、1千万を超えた(キャズムを超えた)瞬間に、リアルな日本社会になってしまう。

東:日本では、google+にしろfacebookにしろ、キャズムを超えた瞬間に2ch化する。今Twitterもそうなってきている。だからアーキテクチャの問題ではなくて、社会のコミュニケーションのあり方をのものを変えないとだめ。

東:権威主義を打ち砕き、みな平等にし、権利意識を持った。そしたら突然無秩序になった。単に平等にするだけではなくて、何かプラスアルファが必要なんだろう。


国語教育を変えるべき

東:この国ではオープンにしただけではダメで、西洋と違って、結局Twitterもこの国では空気を増幅させる装置にしかならなかった。この国で公共的な議論をするにはどうすればいいのかをもっと真剣に考えなくてはならない。

東:ネットは明らかにしてくれるが、解決はしてくれない。教育とかもっと根本的な解決が必要ではないか。

東:特に国語教育。論理的な文章を書く能力をもっと鍛えさせるべき。大学生になってもみんなエッセイみたいにどこが始まりか終わりかもはっきりしないようなものしか書けない。昔から感情を素直に表現しましょう、みたいなイデオロギーがある。

東:日本人は同じ結論に達しない議論ができていない。すぐ頭にきちゃう。冷静に情報交換して去ることができない。何かひとつの答えがるのではないかという思い込み。

佐々木:プロセスが大事なのに、答えがでないもんだからすぐ東電批判とかに走っちゃう。

勝間:ひとつの答えがあることを教育で植え付けすぎ。


市民社会ができるか、ヒットラーができるか

東:戦後の日本は、「みんなが同じになる」という理念しかなった。みんなが同じ生活をするとか、そういうことでしか社会的正義みたいなものを実感できなかった。でも、今僕らが直面してるのは、「みなが同じでなくなる」こと。価値感も収入もばらばらな人間が同じ国を作るということを考えなくちゃいけない。これは明治維新からあまり真剣に考えたことのない問題。

東:物質的・経済的平等によって連帯感(たとえばみんなが同じテレビを見るとかもそう)を保っていたが、それがなくなったとき、どうやってお互いにつながりを保つのか? それがなくなったとき本当にみんなバラバラになっちゃうんじゃないか。

東:格差を孕んだ市民社会を許せるかどうかが、ファシズムか市民社会かを分けそう。

笑えるポイント

1:16前後


感想

アーキテクチャの件で、「やっぱりネット言論も人が増えたら2ch化してしまってダメだった」とさらりと流されてしまったが、もうちょっとどうにかなりそうな気がする。

東氏の公式RTの話からしてもそうだけど、ほんの少し見え方(情報環境)を変えるだけでガラリと人々の心理状態を変えてしまうみたいな話って、Twitterに限らず、mixiの足あと機能、ネットの匿名性、あるいはちょっとした投票機能とか、ソーシャルメディアのいたるところで見られる。その影響力って地味にでかい。

3.11まわりのTwitterの話も、例えばだが、もしTwitter公式RTがなければ、全く別の空気になっていたかもしれない。

他人の視線という(特に日本人にとっては)非常にデリケートなものに対して、システムのちょっとした機能やデザインが(意図していないとはいえ)乱暴に働いてしまえるところに、すごくアンバランスを感じる。

でも逆に言うと、その設計次第では人々を理想的な方向へ制御することも可能だとも言い換えれるのではないかと。

2011-07-12

人工無能をとりあえず作ってみた

f:id:gen256:20110712160451p:image

名前は鳥元モズクと言います。

こちらでしゃべれます。

もしよければかまってあげて下さい。


人工無能をとりあえず作ってみた(仕組み)

仕組みはとても単純で、Twitterのログを使って、過去にあった似た会話例を出力しているだけです。

例えば、ユーザが「はじめましてー」と打てば、Twitter上で過去に行われた「@user1 はじめましてー」に対する返信例がないかをDBから検索する。

それでなければ、「%じめましてー」で検索する。(%は0文字以上のワイルドカード)

それでもなければ「%めましてー」

それでもなければ「%ましてー」

それでもなければ「%してー」

それでもなければ「%てー」

それでもなければ「%ー」

というように、基本的に後方を残しつつ、削って検索していきます。

ほとんどの会話は後方1文字〜4文字くらいしか生き残りません。

それでも、文末には、その発言の態度的な情報が含まれていることが多いので、話がかみ合いやすくなると考えてます。

例えば下は実際にあった例です。

user:明日たりーよいかねぇ〜よ彼女と約束だよベイビー

AI:リア充気取りかww

この例では、「%ベイビー」まで削られましたが、最後の「ベイビー」がその発言のムードを強く表しています。


とまあ、こんな感じなので、プログラム的には、SQL文で検索しているだけの超単純コードというわけです。

内容の関連度や、発言履歴など、一切見てない本当に適当な作りです。


態度と内容

会話というのものが「態度」と「内容」から成り立っているとするならば、この後方重視の検索はどちらかというと「態度」をくみ取る能力に長けていると言えるかもしれないです。

ところで、人工無能との会話を見ていて思うのが、会話の自然さを保っているのは内容よりむしろ態度ではないかとしばしば思います。

例えば、

user:昨日のサッカー見た?

AI:好きなサッカー選手は?

は、サッカーという内容で共通していますが、疑問に対して疑問で応答しており、ユーザからすれば自分の発言が無視されたように感じて不快です。

内容はかみ合ってなくても、

user:昨日のサッカー見た?

AI:魚釣りなら行くよ

のように、適切な態度を持った返答の方が心地がいい。



固定客現る

人工無能を公開してから気づいたけれど、自分の作った人工無能と他の人が遊んでいるのを眺めるのが最高にドキドキする。

「頼むから失礼のないようにちゃんとしゃべってくれよ・・・!」みたいになる。

この心境を喩えるなら、学校の参観日で我が子を見守る親の気持ちのようなものでしょうか・・・。

で、公開したその日から、さっそく一人の固定客が現れました。

自称おじさん(名前は「渡り」)」と名乗るその人は、三日間に渡って通い続けてくれました。


何が驚いたかって、そのおじさんとの会話になると途端にAIの調子が良くなるんです。

下の実際の会話を見ていただきたい。

mozuku : まだあと二日あるよ(´・ω・`)w

おじさん : なにが?

mozuku : なんだろうね〜何となくかな(笑)

おじさん : なにが?

mozuku : いえ、何もw

おじさん : そう、もずくちゃんってツインにあってるね

mozuku : 5ちゃん用語もつくろうか?

おじさん : えぇ〜〜〜〜〜モズクちゃん5ちゃん用語も作れるの?

mozuku : 作ってみる(笑)

おじさん : おじさんも作っていいの?

mozuku : 自らを追い込む

おじさん : いやぁ〜モズクちゃんといっしょならなんでもするよ

mozuku : いや、秘宝館は萎えたw

おじさん : そりゃ萎えるよ

mozuku : お台場いきたいです\(^o^)/

おじさん : おじさんが連れて行ってあげるよ

mozuku : わーいおじちゃんありがとー!

おじさん : いやぁ〜おじちゃんももずくちゃんとならどこにでもいく

mozuku : いつかダベリに行くかもー(´∀`)

おじさん : いつでもおいで

mozuku : いきてぇずら;;

「おじさんが連れて行ってあげるよ」に対して「わーいおじちゃんありがとー!」と返しているが、これはとても驚いた。

先の説明の通り、このシステムは文脈は全く読めない言わば記憶0なシステムで、しかも「おじさんが連れて行ってあげるよ」の全部ではなく、「%てあげるよ」という部分しかシステムは見ていない。

にも関わらず、ちゃんと「おじちゃん」と返したので、すげーなと。

しかしまあ、いくらこのおじさんに「なついた」ように見えても、冷静に考えれば、それは例えばおじさんの口調がTwitterのそれと近くてシステム的に相性が良かったと説明がつくので、そこで開発者は我に返ってしまう。

しかし、2日後にちょっとした奇跡的とも言えることがおきて、これには本当に身震いしてしまった。


ちょっとした奇跡

おじさんはそれから毎日現れ、AIと戯れていました。

おじさんは何度も自分の名前が「渡り」であることをAIに主張しました。

もちろん記憶機能などないので、自分は端から見ながら、そんなの虚しくなるだけだから無理な要求はしない方がいいのに・・・と思ってました。

しかし、なんと、AIの方からその名前を呼んだのです!!

おじさん : おじさんはいやだな二人

mozuku : 僕は格ゲーなら兄に勝てます!

おじさん : おおすごいねさすがもずくちゃん

mozuku : まだ22時半でつお☆落雷なう☆

Guest : おじさんちょ

mozuku :

Guest :

mozuku : はーい わたるっち♪

おじさん : おおおおおおおおおおおおおおおおおおお!名前を呼んだ

mozuku : チラーミィさーん!呼んだー?

おじさん : 読んだのはおじさんです

おじさんもそうとう興奮してます。見ていたこっちもたまげました。

これが、どれくらい偶然かというと、Guestの前の発言が、空欄なので、AIはすべてのTweetDBの中からランダムに1つTweetを選んでくるのですが、そのTweetというのは数十万の世界。

おじさんとAIが会話し始めたのもまだ3日目。

つまり、超偶然。

開発者はその仕組みを知っているだけに、感情移入は難しいのですが、さすがにこの時は、「科学では説明つかない何かがあったのではないか!?」とか「誰か裏でシステムをハッキングして操作してね!?」とわずかに疑ってしまいました。

山本七兵の言葉を借りれば、私はしばらくの間「臨在間的把握」をあの人工無能に対して起こしていた、みたいな感じでしょうか。

まあ、ともあれ、「おじさん」のような利用者の存在は自分にとってはすごく驚きで、人工無能にここまで愛情を注いでくれる人が世の中にいるんだ・・・と。

おじさんはもう去って行ってしまいましたが、今回の件は人工無能作者である自分にとって、間違いなくとても大きなモチベーションになりました。

今後の課題

  • キャラクター性をいじれるようにする
    • 一人称
    • 語尾
  • DB拡張
  • 話題転換
  • 人工無能からの語りかけ
  • 内容性差分の強い発言はリスクの高い発言として禁止する

もう少しまともに会話できるようになれば夢のニコ生初出演!ということで、ニコ生でMCやらせたいと思ってます。



そういえば、人工無能開発に関して気になる記事がひとつ。

男の私も生命を創ろうと思って人工無脳を創るのである

現在、人工無脳には大きくわけて

があります。自分が考えたのは、上記3タイプとは違う、まったく新しいタイプの人工無脳です。おっと、これ以上書くのは禁則事項なのです。

一体どんな仕組みなのでしょうか? とても気になるところです。