Hatena::ブログ(Diary)

たかとらのメイド喫茶リスト このページをアンテナに追加 RSSフィード

2009-01-30

ニコニコ動画データ分析研究会のUstreamログを集計してみた

| 19:30 | ニコニコ動画データ分析研究会のUstreamログを集計してみたを含むブックマーク ニコニコ動画データ分析研究会のUstreamログを集計してみたのブックマークコメント

 25日の日曜日、ニコニコ動画データ分析研究発表会に聴講者として参加しました。

 あまりの素晴らしさに、提出が来週に迫っている修士論文をそっちのけにし、今すぐにでも僕もデータ分析をやり始めたい勢いですw とりあえず何かてっとり早くできることがしてみたく、Hot.Docsに公開されている発表会のUstreamログを集計してみました。

 ログの開始時点は12時16分で、終了時点は17時ジャストです。コメント数は7900件で、発言者の延べ人数は334人でした。コメントの発言時刻は分単位で記録されていたので、1分刻みで集計しグラフ化してみました。

 コメント数が最も多かったのは、14時49分で120コメントでした。グニャラくんがタグ共起ネットワークを見せて、荒らしタグのクラスタや、アイマスクラスタの説明をしていたところです。2番目にコメント数が多かったのは、13時41分で116コメントでした。てってってーPさんが若干タイムオーバーしつつも、最後に宣伝をして締めくくったところです。

f:id:TAKATORA:20090130212941j:image

 w数というのは、末尾がwで終わっているコメントの数です。発表者ごとに総コメントに対するwを含むコメントの割合(w率)を集計すると、w率の高い上位5人の発表者は、

発表者総コメント数w数w率
グニャラくん213085740.2%
伊藤聖修 36512734.8%
日本野望の会35111432.5%
濱野智史 41012731.0%
myrmecoleon35210529.8%

となり、グニャラくんが1位でした。グニャラくんは、本人曰く「ジョーク枠」ということでしたので、本望なのでは! 解析結果が美しい上に笑いもとれるなんて、うらやましいです。ニコニコ動画のコメントにもwは頻出するので、集計してみるのもおもしろいかもしれません。

 次に、「88」「ぱちぱち」「パチパチ」のいずれかを含むコメント数をカウントし、拍手数としてみました。まあ、当たり前ですが、各発表の終了時点にきちんと集中しています。この傾向を利用すれば、拍手の突出したところを刻み位置にし、音声や動画を発表者別に自動分割することもできそうですね。

f:id:TAKATORA:20090130222615j:image

 とにかく今回の発表会は、僕にとって大きな刺激になりました。タグの解析はかなり進んでいるようなので、コメントの解析をやってみたいところです。とは言っても僕はプログラミング能力が低いので、どなたかデータをおすそ分けしていただけないでしょうかねぇ。いやはや。

トラックバック - http://d.hatena.ne.jp/TAKATORA/20090130/1233311403