Hatena::ブログ(Diary)

たけいの日記 RSSフィード

2009-01-26 ニコニコ動画データ分析発表会(1/25)に参加した このエントリーを含むブックマーク このエントリーのブックマークコメント

昨日、六本木GLOCOMで開かれた「ニコニコ動画データ分析発表会」という勉強会に参加しました。

ニコニコ動画は、

  1. 動画を見て、コメントして楽しむというテレビ視聴的な楽しみ方
  2. 動画を作って、アップして楽しむというクリエーター的な楽しみ方

がありますが、もう一つ、 そこに集まる人やデータを集めて、解析して、ニコ動の中のトレンドを知るという、マーケターのような楽しみ方もあります。

ランキング動画作成などはそうですね。 ほかにも、社会学的に、「インターネットコミュニティでの人々の集まり方は現実世界とどう違うんだろう」なんていうアプローチをするのもそうです。

主にそういうデータを集めて解析するということに興味を持った人が集まったのがこの勉強会。

まさに「ニコに関して頑張る」っていう人たちが集まった勉強会ですな


すでに一日が経過して主だったエントリはでているので、内容についてはそこへのリンクを張ることにとどめ、感想をつれづれに書いていきます。

内容についてはこちらを参照ください:

予稿

http://www.hotdocs.jp/group/detail/172

よくまとまったメディア記事(私の後ろ姿もどこかに写ってます)

「膨大なデータを分析して見えてくること」ニコニコ動画データ分析研究発表会:CodeZine

http://codezine.jp/article/detail/3516

合わせて9つの発表がありましたが、大きく2つのテーマに分けられるように思いました。

- ニコ動からのデータ収集のためのノウハウ、トレンド分析

- タグ分析


前者の方は、主にアイドルマスターランキングなどの作成のためのシステムの裏話を興味深く聴きました。

たとえば、アイドルマスターはもう全体で6万件近くの投稿があるので、手作業で人気動画を探すのは不可能。

かといって、単純にニコ動に機械的にリクエストをだすと、すぐにアクセス一時停止となってしまうそうで、インターバルの調整などノウハウが必要だそうだ。

「特定のタグについての総投稿数の概数を3回のアクセスで求める」という趣旨の発表もあった。確率統計的なノウハウを活用して、あるタグがついているすべての動画の再生数の合計を、3回のニコ動へのアクセスで、誤差が数%で求めるというもの。

本来はニコ動システムタグを指定すると「このタグがついている動画の総アクセス数はxxxx回」というように表示されれば不要にも思えるけれど、現実にはついては消えていくタグシステムが把握して追っていくのは難しいのかな。

トレンドの分析も、興味深かった。 発表者の方は統計的なスキルを持っている上に、ニコ動のコンテンツや祭りに愛を持っている方なので、見てみて「うんうん」とうなずけることが多かったな



後者のタグ分析。 ニコ動に限らず最近のWEB2.0的なアプリでは、ユーザが自由にカテゴリをつけられる方式が普通。

システムでがっしりとタグ名が決まっている「タクソノミー」に対してユーザで自由にタグ付けをする「フォークソノミー」は自由度が高いため、情報の整理が難しいけれど、でもそこは、WEB2.0の王道の技術だけあって、世界中の研究者が寄って集まって、解析手法を研究している分野なのですな。

そういえば、 この間のSBM研究会もこのようなネタが多かった。

今回はこの分野の発表も興味深い。 使った方式についてはよく分からないけれど、 得られた結果は分かりやすい。

「このタグとこのタグは近い」「タグを構造化すると、親タグになるのはこれで、子タグになるのはこれ」というようなものを機械的に求められるのですな。

例えば、「アイマス」と「車載動画」の関連は強いだとか、 「東方」は「ゲーム」よりも「歌ってみた」が近い、「おっさんホイホイ」は「VOCALOID」に近いなどといった情報が機械的に解析出来るのです。

これって、興味だけじゃなくって、マーケティングにも活用できるよなあ。

解析だけじゃなくって、見せ方(ビジュアライゼーション)も研究が進んでいる。

仕事と少し離れた領域の話を聞くのは脳みそに心地いい刺激があるなあ。

ただ、タグ解析(タグの共起分析というようですが)については、ランキング動画よりももっともっとニコ動システムに負荷をかけることとなり(ランキング動画の解析はアクセス回数 O(N)に対してタグ解析は O(N^2) ) 、現実的にはタグの数は1000個程度しか解析できないとのこと。

ランキングについても思ったのですが、こういうデータ分析発表会で発表するような人向けに、ニワンゴで専用のAPIを提供してもっと自由に統計情報を活用出来る仕組みがあるともっとランキングタグ分析など活発になりそう。 今回のデータ発表会で、データ分析は、解析する人の自己満足じゃなくって、多くの利用者にとっても興味があるデータが得られるという事例が多かったので、検討されないかなー なんて期待します(^^


二次会

二次会は秋葉原。47人ぐらい集まってたでしょうか。id:koizuka id:AOI-CAT id:kynbit や多くの参加者の方と3時間近くニコ動オンリーで濃いー話で盛り上がってました。

どこまでオフレコだったのか分からないので具体的なネタかけないですが、ニコ動ってそうやって運営されているんだー と驚いたり納得したり。


有意義な一日でした


※ 二次会で話題にでた動画の一部


「これって、権利者が上げているよね−」的なネタ

D

D