第21回 データマイニング+WEB@東京( #TokyoWebmining 21th)−ソーシャルグラフ解析・ビジネス展開 祭り− を開催しました

2012/08/26 "第21回 データマイニング+WEB@東京−ソーシャルグラフ解析・ビジネス展開 祭り−"を開催しました。

会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧:

参加者Twitter List: Twitter List TokyoWebmining#21
参加者セキココ:第21回 データマイニング+WEB @東京 セキココ
(作成してくれた @Prunus1350 さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員自己紹介」(75分)

進行 :[Twitter:@hamadakoichi]


1.「商社のデータマイニング-Case2-新商品の予測」(講師: @Shumei ) (ケース説明10分+議論40分+ケース解答5分)

統計解析・データマイニングを実ビジネスに活かすには肝がある。今でも TokyoWebmining で語り継がれるビジネス展開のケーススタディが今回、再度登場。ぜひみなでケースから学び実活用へつなげていきましょう。

  • 状況
    • 1年で新商品は 3000-500。
    • 在庫回転率:30.4。よく回る。11日で全店頭在庫が入れ替わる。
  • 新商品発売後、各2日での増加分のデータでクラスタリング
    • 惣菜、おにぎりのクラスタ。惣菜のほうが、おにぎりより長く売れ続ける
    • 商品カテゴリを詳細に分け、時系列パターンを増やす
  • モデル化するポイント

2.「Suicide ideation of individuals in online social networks」(講師: @millionsmile ) (発表25分 + 議論30分)

SNSmixi」のデータを使い、自殺とソーシャル・ネットワークの関係について統計的分析を行った研究結果です。

  • 自殺者。10万人に 19人 (0.019%)。日本多い。
  • ロジスティック回帰、単回帰
  • 自殺コミュニティ参加している人の特徴
    • 友達数、クラスタ係数少ない
    • 通常の人の6倍のコミュニティに参加している。
    • コミュニティ参加したが、友達ができなかった人が自殺コミュニティに参加しているのでは。
    • 実名SNS、自殺コミュニティ、

なぜ3人いると噂が広まるのか 日経プレミアシリーズ

なぜ3人いると噂が広まるのか 日経プレミアシリーズ

複雑ネットワーク―基礎から応用まで

複雑ネットワーク―基礎から応用まで

3.「Importance of individual events in temporal networks」(講師: @t_takaguchi ) (発表25分 + 議論30分)

「誰と誰がいつコンタクトした」というイベントの時系列としてデータが与えられたとき、各イベントの重要度をどう決めるかという問題について、我々の研究結果を紹介します。

  • 人間のイベントエッジに時系列の要素も取り入れる
  • どのイベントが重要かの算出
  • 大事さ:2人間で定義される。該当イベントエッジと前のイベントエッジの時間差で、長いほど重要度高い。
  • Vector Clock
    • どのタイミングの誰の情報を知っているか
    • そのイベントで前のイベントタイミングからどのくらいの時間期間の情報をアップデートできたか。
  • Time Windowの設定。同時情報伝達数の設定。Time Windowが短ければ、同時情報数は少ない。
  • 重要度が非対称。どちらかがデータソースになった伝達が行われている。
  • 重要情報から削っていくと reachability が 2割下がる。

4.「大学生のTwitter利用に関する定量分析」(講師: @who_you_me ) (発表25分 + 議論30分)

「誰と誰がいつコンタクトした」というイベントの時系列としてデータが与えられたとき、各イベントの重要度をどう決めるかという問題について、我々の研究結果を紹介します。
他のSNSと比べた際のTwitterの大きな特徴の一つである「非対称型のソーシャルグラフ」(いわゆる「片想い」)。この特徴がTwitterの利用のされ方にどのような影響を与えているのかを、Twitterのボリューム層である大学生のアカウントの分析から明らかにした研究です。
今回はおまけとして、これからTwitter分析を始める方へのアドバイスに加え、更にはTwitter分析を志す者なら誰もが気になっているであろう、Twitter APIの新バージョンについても、分析者の立場からご説明いたします。

  • あるコミュニティに絞った分析。大学生のリスト
  • データ収集
    • Twitter List から hitotsubashi, hito-u 等等のリスト収集
    • 2010年12月- 11年9月
  • コミュニケーション利用者は一方向フォロー 19%、情報発信者では片思い 35%
  • Twitter解析でのデータ処理
  • 参考文献:

集合知プログラミング

集合知プログラミング

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

Twitter API プログラミング

Twitter API プログラミング

Salsa Dancing into the Social Sciences: Research in an Age of Info-glut

Salsa Dancing into the Social Sciences: Research in an Age of Info-glut

■声・議論:

D. 「参加者の声・ディスカッション」 (60分)

進行 : id:hamadakoichi [Twitter:@hamadakoichi]

参加者全員での振返り結果MindMap

  • 継続したい良かった点
  • 改善点アクション
  • 次回AGENDA

第21回データマイニング+WEB@東京 (2012/08/26) 継続したい点・改善点・次回以降AGENDA - XMind - Mind Mapping Software

推薦文献

集合知イン・アクション

集合知イン・アクション

集合知プログラミング

集合知プログラミング

関連ツイート(Togetter)

「第21回 データマイニング+WEB 勉強会@東京−ソーシャルグラフ解析・ビジネス展開 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)
第21回 データマイニング+WEB@東京 ( #TokyoWebmining #21) -ソーシャルグラフ解析・ビジネス展開 祭り- - Togetter

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容: