アメリカ在住オタは電気ウナギの夢をみるか。〜オタク文化伝導日記〜

分室: ネギま!で遊ぶ (4/27更新)
お勧めはカテゴリは[米オタ文化][文化]あたり

2005-03-11

t33032005-03-11

[][]登場頻度でクラスタリング


ふと思い立って、上のようなグループ分け図を作ってみました。(http://t3303.ifdef.jp/negima.html


小さいグループほど似た傾向を持っていて、離れるにつれ関係が薄くなっていきます。


大きく分けるとまず、(ネギ,明日菜,木乃香,刹那)の頻出組とその他の組に分かれているのがわかると思います。頻出組を細かく見ると、(ネギ,明日菜)の傾向が似ており、それに木乃香、刹那が続くというような構造になっています。


アキラの位置がちょっと微妙なのと、朝倉とあやかが同じグループなのが意外だったりしますが、結構きれいにまとまっていると思いませんか?


ところでこれ、実はプログラムで自動生成したものです。


キャラの各話での登場回数を基に、似た傾向で登場しているキャラ同士を自動でグルーピングさせました。


こうしてみると、登場回数という簡単な情報が、ネギま!人間関係を強く反映していることがわかると思います。


分かりやすいところではチアのグルーピングが((美砂,円)桜子)となっていますが、これは桜子が頭一つ分くらい登場回数が多いのを反映しています。


逆に((のどか,夕映)ハルカ)は登場回数が少ないハルカが外れています。


(美空,ザジ)は出てない組w


(まき絵,クー)はバカレンジャーネギの特訓などで一緒に活躍しています。それにくっつく楓はバカレン繋がりや、クーとの武道繋がりでしょうか。


(亜子,裕奈)にくっつくさよは、どうやら74話のさよの回繋がり。実際、さよと一番相関度が高いキャラは裕奈だったりします。


最後に意外と思われた(朝倉、あやか)ですが、これはよく考えると修学旅行で同じ班だったりしています。これはこの図をみていて思い出しましたw このように、ある意味知識の発見的に使えるのも便利です。


ちなみに全体を見渡すと、上から下にかけて、大体登場頻度順に並んでいるのもわかると思います。これは似ているほど近くなり、似ていないほど遠くなるので自然と頻度順に並ぶ結果になったようです。




せっかくなので、グループ分けに使った手法も簡単に解説しておきますw


まず最初に行うのは、各キャラごとに、各話の登場回数の数字を一直線に並べる作業です。今回もデータは魔法先生ネギま!研究所からお借りし、各キャラごと1〜84話までの登場回数を表にまとめました。


次のステップは、各キャラの組み合わせごとの、相関度の計算です。


今回はネギも含めて32人のキャラクターが居るため、2人組にしたときの組み合わせは496パターンあります。そこで、それぞれの組み合わせに関して、一人目のキャラをx、二人目のキャラをyとすると、例えば、(明日奈の1話での登場回数,木乃香の1話での登場回数)を(x1,y1)のように表すことができます。今回は84話分なので、組み合わせごとに84個の点がプロットされます。


次に、この各点の情報を基に、積率相関係数というものを計算します。イメージ的にはこんな感じになります。


つまり、組み合わせのキャラの登場パターンが似ていれば似ているほど、この数値が大きくなると考えてもらえばOKです。


この作業により、どのキャラとどのキャラの登場パターンが、どの程度似ているのかがわかりました。


ここまでが前半です。後半では、この情報を基にキャラクターグルーピングしていきます。



グルーピングにはいろいろな方法があるのですが、ここでは、この場合に最も適していると考えられる階層的クラスター分析という手法を使いました。


簡単に説明すると、似たもの同士を同じグループまとめるのを基本にしつつ、順にグループに加えていったり、グループ同士を大きなグループにしたりといった作業を続けることにより、最後に一つのグループにまとめてしまうといったやり方です。


これにより、トーナメント表のようなグループ構造が実現されます。


具体的にみていきましょう。


まずプログラムは一番相関度が高い組み合わせを探します。この場合は(千鶴、夏美)でした。次にこの(千鶴、夏美)を一つの組として考えます。2人で一組なので、公平のため千鶴、夏美が持っていた値の平均をとって、それをグループの値とすることにします。これで、次からは(千鶴、夏美)を一つのものと考えることが可能になりました。


次に、同じように一番相関度が高い組み合わせを探します。今度は(美空、ザジ)だったので、上と同じ作業をします。


次に見つかったのは、(美空、ザジ)と真名の組み合わせです。(美空、ザジ)はもう既に2人で1人なので、新しい組み合わせは((美空、ザジ)真名)というようになります。


あとは、この過程をグループが一つになるまで繰り返していけば完成です。



と、このような過程を経て今回のグループ分け図が完成しました。


自分でも、たかだか登場回数の情報で、ここまで正確なキャラ相関図が描けるとは正直思っていませんでした。


しかもこの図は、クーとまき絵の意外な繋がりや、あやかと朝倉の組み合わせのように、普通に読んでいたらちょっと気付きづらいような関係も見事に現しています。


これはクラスタリングと呼ばれる人工知能の手法なのですが、ネギま!にも応用できるとは意外でした。これからも何か思いついたらいろいろ試していこうと思います。

2005-03-08

[][]レポートを妄想してみる


今学期は2本ほど期末レポートを書かなきゃならないんですが、いい加減学期も半ばなんでそろそろ構想(妄想)でも練ってみました。


とりあえず最初に思いついたのは、ネギま!マンガのページをプログラムに渡して、どのキャラが何回出てるかを数えさせる、言わば自動登場コマ数確認プログラムの作成、、だったんですが、さすがにこれはむずいw


キャラ数の多さは言うまでもなく、バックグラウンドの描き込みも複雑、吹き出しが顔にかかる割合が多すぎ、関係ないキャラも多い、顔の大きさ、向き、トーンなどの効果が場面によって非常にまちまち、顔がすぐ切れる、などムズ過ぎる要素満載でした。さすがにこれをレポートでやる気はしない。


というわけで、とりあえず対象のマンガを「ドラえもん」辺りにしてまずやってみて、うまくいったら「あずまんが」辺りでも試してみようかなという方向で落ち着きました。


ドラえもんは吹き出しで顔が切れないのが感涙ですよw


アルゴリズムの方針はだいたい決まったんですが、それでもやっぱりムズいんで、最初の方針で成功する可能性は半々くらいでしょうか。後は試行錯誤になりそうです。



もう一つ考えているのは、画像を渡すと描いた絵師さんを判別してくれるプログラムの作成です。お絵かき掲示板から数百枚単位で持ってきた画像を渡し、各絵師さんの特徴を憶え込ませ、新しい絵を見せたときに誰が描いたか判別させるというものです。


これも大体方針は決まったのですが、一二枚しか描かない人が結構いそうなのと、学習していない人の絵が出てくる割合も多そうなので、しっかり動かすにはもうちょい考えないとダメかも。


あと、なにげにめんどくさいのはカラー画像の扱い。jpgを読み込んで処理できる形に変換するのがめんどい、つうかやってられんw どっかにRGBに分割してくれるソフト落っこってないでしょうかw


このプログラムはもっとがんばれば、ネットから萌え系の画像だけを自動で拾ってくるプログラムとか、エロ画像フィルタリングするプログラムに応用できるかも。もしかして後者はもうあるかな?



などと楽しげなプロジェクト妄想を語ってみました。自分へのハッパのために公表したってのもありますが、さて、どこまで実現できるか。


2005-02-27

[][]天才、Mark Rosheim氏の発想法


今日はロボット業界では天才と言われている、Mark Rosheim氏のバースディパーティに参加する機会をもらえたので、いろいろと興味深いお話を伺ってきました。


彼はロボットアームの自由度が2だった時代に一気に7まで押し上げ、さらに人工知能まで搭載した人物です。


しかも高校中退→研究者→社長という天才の王道を歩いている人で、現在16個ものロボットに関する特許を個人で取得しているとのこと。(全米1位らしい)こりゃホンモノですわw



まず最初に、ASIMOを見てきたというので感想を聞いてみたところ「よく出来たオモチャ」との返答w いや、マジで何も言い返せなかったw 確かに研究者の視点から見れば、ASIMOは基本的に新しいアイディアを使っていません。これまでもたらされている研究成果を、大金をかけて精密に実装したというのがホントのところです。というわけで、彼はあまりASIMOには興味が無いようでした。


次に発想方について。彼は昔から3Dのイマジネーション能力が高かったらしく、数学的な作業を行わずに、機械の構造のイメージが頭に浮かんでくるそうです。どこまでホントかはわからないですが、数学はほとんどやってないとか。頭に浮かんだイメージを元に試行錯誤することによってクリエイティブな機械を作ってきたそうです。


うわー、天才だぁ、こりゃかなわん。と、最初思ったのですが、ここで終わっては何も役にも立たないので、さらに色々突っ込んでみました。すると、やっぱり出てきましたよ。我々にも十分実行可能で、誰もが一度は思いつくのにも関わらず、ほとんど誰もがやらないか途中で投げ出すことが。


まず、新しいエリアに踏み込むときは、徹底的に、集められるだけの資料を集め、学会に参加し、多くの研究者と直接話して最新の情報を聞き出すそうです。その分野のことを徹底的に調べ尽くすのが第一ステップのことでした。


また、彼は本を集めるのが趣味で、興味を持った分野に関しては、金を惜しまず徹底的に本を買い漁るそうです。これも高校時代から続けているそうで、分野は偏るけど、非常に楽しいとのことでした。


天才っぽいなって思ったのは、レオナルド・ダヴィンチの残した大量のノートを見ることによって、アイディアを得ているという点でした。彼は機械寄りのロボット工学者なので、ダヴィンチの精密に描かれた数々の機械は非常に刺激になると言っていました。


そして、思いついた全てのアイディアノートに書き留める。彼はこれを高校時代から続けているそうで、ノートはもう200冊を超えたとか。


最後に、アイディアを出す課程や実装の課程で必要とされたり新たに興味を持った知識を補います。


まとめると、土台を作る→アイディアを出す→足りない知識を補う→アイディアを出す→足りない知識を補う、の連鎖を作り出すと。


後はこれを、毎日欠かさず続けるそうです。


やっぱ、才能があって努力を欠かさない人が最強なんだなあ。少年漫画で学んだ通りだ(ぉぃ

2005-02-26

[][]ASIMOについて


今日のボランティアが終わった後、HONDA U.S.A.の技術スタッフの方に、気になったことをいくつか質問してきました。生の質問・解答を書くと酷いことになるので、項目ごとに簡単にまとめてみます。


ASIMOの動きについて:

動きは全てあらかじめプログラムされていて、操作する人がボタンを押すたびに、あらかじめプログラムされていた次の動作を行う。それとは別に、各種動作キーがあり、それを押すことによりあらかじめプログラムされた動きをする。階段に関しては、昇降可能範囲ならばあらかじめプログラムすることにより、どのような形の階段でも昇降が可能。


マーカーについて:

(マーカーとは、ロボットが自分の位置を再確認するために使う印みたいなもの。オドメーターの誤差により自分の位置の誤差のコバリアンスが増加するため、一定時間置きに誤差修正が必要になる)

ステージに立っていたポールはマーカーではない。マーカーとして利用していたのは、ステージ上のチェッカーのみ。位置誤差修正はステージ上で3回、階段を上る前に1回、階段の上部で一回のみ。歩行による位置誤差は極めて小さい。


顔認識について:

今回ののASIMOのバージョンは1.5で、顔認識機能も搭載されている。しかし、ステージ上ではライトのあたり具合が不安定で精度が著しく落ちるため、デモは行わなかった。バックグラウンドからの切り出しについては問題なし。教授を招いて行った特別セッションではデモを行ったが、精度はイマイチだった。


発声について:

テクストtoスピーチ。デモ映像では、俳優が自己紹介した後ASIMOが彼の名前を呼びかけていたが、これはあらかじめ名前がインプットされたものであり、音声認識後に名前をテキストに変換し発声したものではない。


ASIMOの開発について:

約100人ほどの技術者が関わっている。本体はほぼ日本で開発されたが、顔や音声の認識パートはHONDAアメリカ支社がメインで開発を行った。

2005-02-25

t33032005-02-25

[][]ASHIMOが来た


ウチの大学にASIMOが来てここ3日ほどステージショーをするのですが、せっかくなので何か役得にありつけないかとボランティアスタッフをやってみることにしました。


で、今日一回目のショーに行ってきたんですが、さすがHONDAが世界に誇るヒューマノイドだけあって、きれいに動きます。床にマーカーがあるのは、まあご愛嬌かw


実は今回、顔認識などのやや人工知能よりのデモを期待して行ったのですが、残念ながらそれは動画での紹介のみ。バックグラウンドノイズの除去の問題と、ASIMOのバージョン違いが理由かなと思ったので、明日技術スタッフに聞いてみることにします。



顔認識等のデモ:http://asimo.honda.com/movie/qt_download/intelligence_tech_300.mov


公式:http://www.honda.co.jp/ASIMO/


CGIレンタル