2012-01-24
■[Webmining][R][NLP] データマイニングCROSS 2012を開催します - #TokyoWebmining x #TokyoR x #TokyoNLP x #DSIRNLP - #CROSS2012

2012/01/27(金) CROSS 2012で「データマイニングCROSS - データマイニングの実ビジネス・サービス活用と展望」を開催します。
TokyoWebmining 主催の濱田晃一(id:hamadakoichi : @hamadakoichi)とTokyo.R主催の里洋平(id:yokkuns : @yokkuns)がモデレータを行い、TokyoNLPやDSIRNLPコミュニティ、医療・広告・検索・マーケティング・金融工学など各分野、幅広い方々に登壇して頂きます。
CROSS 2012
CROSS 2012は1000人規模のエンジニアコミュニティのクロスイベント。
以下のような技術コミュニティクロスのセッションが開催されます。
- データマイニングCROSS (DataMining/MachineLearning/Statistics/R/Mahout/Hadoop)
- スマートフォン CROSS (Android/iPhone/Titanium)
- クラウドCROSS (Operation/Infra/Cloud/Document)
- 次世代LAMP CROSS (Node/MongoDB)
- 次世代言語CROSS(Scala/Haskell/Python)
- フロントエンドCROSS (UX/デザイン)
- JavaScript CROSS (HTML5/Node/Titanium)
以下、データマイニングCROSSの「内容概要」と「AGENDA」を記載します。
データマイニングCRROSS 内容概要
データマイニングの活用により、蓄積データから有効な法則性を見つけ出し、適切な意思決定やビジネス・サービス洗練を迅速にそして継続的に実現する。2011年大規模分散処理技術・データ基盤の普及によりその可能性はさらに広がり続けている。しかしながら実はデータマイニングを実ビジネス・サービスで活用・成功してくためには、必要なノウハウがある。
TokyoWebmining や Tokyo.Rは、それらのノウハウ・技術を分野横断して共有・議論し、ビジネス・サービス活用の裾野を広げることを目的としたコミュニティです。今回はこの日限定で2つのコミュニティがクロスしたスペシャルコラボレーション。ソーシャル・広告・マーケティング・検索・医療・金融の各領域の第一線でデータマイニングで活躍しているメンバーを迎え、各業界や業界横断の活用ノウハウ、2012年の展望に関し、共有・議論を行います。
この日にしか聞けない特別なノウハウと議論。データマイニング・機械学習の活用、迅速・継続的なビジネス・サービス洗練に興味をお持ちの方はぜひご参加ください。
http://tech.nifty.co.jp/party/2012/sessions/cRoom1.htm
AGENDA
オープニングトーク:
「データマイニングの実ビジネス・サービス活用と展望」
濱田晃一(ソーシャルゲームプラットフォーム:TokyoWebmining主催・株式会社ディー・エヌ・エー)
第1部クロスパネルディスカッション: 統計解析や時系列解析
里洋平 (ソーシャルゲームプラットフォーム:Tokyo.R主催・株式会社ディー・エヌー・エー)
紀信邦 (ビジネス展開:株式会社ケイエルエス研究所)
倉橋一成(解析コンサルティング:iAnalysis合同会社)
森本修 (マーケティングリサーチ)
teramonagi(金融工学)
佐藤敏紀 (自然言語処理)
第2部クロスパネルディスカッション: 機械学習や大規模分散処理
濱田晃一(ソーシャルゲームプラットフォーム:TokyoWebmining主催・株式会社ディー・エヌ・エー)
中川斉 (マーケティング/広告分析:株式会社ロックオン マーケティングメトリックス研究所)
高田勝裕(広告サプライサイドプラットフォーム:Kauli株式会社)
山崎大輔(広告配信エンジン:株式会社スケールアウト)
上村崇 (ウェブマイニング・レコメンド:株式会社ALBERT)
奥野陽 (検索・自然言語処理)
http://tech.nifty.co.jp/party/2012/sessions/cRoom1.htm
興味がある方はぜひ。ご参加ください。参加登録ページはこちらです。
関連リンク
- データマイニングCROSS 2012- データマイニングの実ビジネス・サービス活用と展望
- エンジニアサポート新年会2012 CROSS
- プログラム|エンジニアサポート新年会2012 CROSS
- スポンサー紹介|CROSS エンジニアサポート新年会2012
- データマイニング+WEB@東京 (TokyoWebmining) | Google Groups
関連記事:
2012-01-15
■[Book][UX][UI] ユーザエクスペリエンスのためのストーリーテリング -よりよいデザインを生み出すストーリーの作り方と伝え方 -

"ユーザエクスペリエンスのためのストーリーテリング"、Designing Social Interfaces 研究会で一緒だった UX Tokyoの @t_maedaさんから献本頂きました。感謝。
ユーザーエクスペリエンスに関わるすべての人へ向けて書かれた本。オススメです。
ユーザエクスペリエンスのためのストーリーテリング -よりよいデザインを生み出すストーリーの作り方と伝え方 -
- 作者: Whitney Quesenbery,Kevin Brooks,UX TOKYO
- 出版社/メーカー: 丸善出版
- 発売日: 2011/12/26
- メディア: 単行本(ソフトカバー)
- 購入: 9人 クリック: 102回
- この商品を含むブログ (10件) を見る
ストーリーテリングは物語や出来事を言葉や音声、イメージなどを使って伝えるための技法。本書では数多くの具体的なストーリー例をもとにストーリーテリングの方法論、活用方法が説明されている。
- ストーリーの集め方(聞く、集める、選択する)
- 作り方(クラフト、構成組合せ、構造・プロットを作る)
- 使い方(デザインアイディアを生み出す、ストーリーによる評価)
- 共有の仕方(共有、伝え方)
ストーリーの最大のメリットは「体験を伝える力」にあると言えます。たとえば映画では、ストーリーを用いることで、私達にとって赤の他人でしかない主人公の体験を、感情を揺さぶるまでに共感させてくれます。共感のあまり映画を見終わった頃には「憧れでしかななかったあの夢を今すぐ実行に移そう」などと決心をする人もいるかも知れません。ストーリーは聞き手の深い共感を引き出し、行動に駆り立てます。皆さんがユーザー体験を調査し、それをストーリーとして共有することでチームのメンバーや上司に深い共感を促すことができます。そのために必要なスキルが、本書で紹介するストーリーテリングです。
UXデザインのストーリーの多くが、人の話をリアリーリスニングで聞くことから始まります。実在する人々を観察し、耳を傾ける時間を確保することでデザインに関する有益な情報を収集することができるのです。身の回りにあるストーリーを見つけることで驚きや発見があるかもしれませんし、そうしたストーリーに耳を傾けることで感情が喚起され、デザインプロセスにおけるストーリーの有用性に気づくでしょう。そのとき、ストーリーは単なるアネクドートから、行動や目標、そして文化の重要な要素を表現することになるのです。
UXデザインでストーリーを使用するのにはもうひとつ理由があります。それは、ストーリーの力を使うことで、新しい視点で世界をみることができるということです。他人が製品やサービスを使った経験やそのコンテクストを理解するのは非常に困難です。しかし、新しい視点からデザイン上の問題をみることができれば、ソリューションまでの道のりのうち、半分は到達しているといえます。悪い経験をよい経験に変える要因は、壮大でイノベーティブなアイデアかもしれませんし、あるいはマイナーチェンジかもしれません。リアリーリスニングは、私達が提供する製品やツール、サービスを利用している人々のことを真に理解することの始まりです。そして優れたユーザーエクスペリエンスを提供するためのスタート地点でもあるのです。
ストーリーは私達を日常生活の豊で深みのある部分に結びつけてくれます。そして、ユーザーエクスペリエンスにおける仕事を通じてどうやって驚きと感動をもたらすかについて考えさせてくれるのです。
ストーリーは、私達に他の方法ではできないことを可能にしてくれます。ストーリーによってキャラクターが生まれ、彼らをコンテクストやメタファ、そしてエモーションと一緒にプロットしてくれるのです。そして、そこからストーリーは私達に新しい発明をするための自由は発想をもたらしてくれるのです。
ユーザーエクスペリエンスに関わるすべての人にオススメの本です。
2011-12-29
■[Mahout][Hadoop]「Mobageの大規模データマイニング」- #PRMU 2011 Big Data and Cloud で講演してきました

電子情報通信学会「パターン認識とメディア理解研究会 (PRMU: Pattern Recognition and Media Understanding)」@幕張メッセ国際会議場 で招待講演をしてきました。
「Mobageの大規模データマイニング」に関して、話しています。
2900万人以上の登録会員をかかえるモバイルソーシャルゲームプラットフォーム「Mobage」では、1日20億超の行動情報が蓄積されています。これらの大規模行動データを対象に、データマイニング・機械学習の各種方法論を適用することにより、隠された法則を解明・より良い解を導出し、迅速なサービス洗練を実現しています。今回の講演では、これらMobageでの大規模データマイニングに関し紹介しています。
PRMU 2011 Big Data and Cloud :Webスケール時代のパターン認識
一億台ものコンピュータが連携して地球規模でサービスを提供するクラウドが出現して以来,情報の共有が人間ネットワークを介して 瞬時に行われるソーシャルメディアが生まれ,さらには散在する情報を幅広く収集しそれを価値化して提供するという情報の社会化の 時代を迎えようとしています.3月11日の東日本大地震をきっかけに,地球規模の気象・環境・生態系,経済活動・人の動きを認識す ることに注目が集まっています.これらの分野に対する注目は一過性のものではなく,ネットワークの進化や経済発展と 環境への関心 が高まるにつれ,今後も引き続き発展することが考えられ,ここに,パターン認識・メディア理解技術が貢献できると考えられます.
そこで,10月のPRMU研究会では,「PRMUの拓く未来:Webスケール時代のパターン認識」という大きなテーマで開催し,「ソーシャルメディア」,「クラウド」,「地球環境」,「経済活動」の4つの分野におけるパターン認識研究のあるべき姿を議論いたしま
https://sites.google.com/site/bigdataandclould/
今回のPRMUのテーマは"Big Data and Cloud :Webスケール時代のパターン認識"でした。
Big Data and Cloud :Webスケール時代のパターン認識
今回のビッグデータに関するデータ処理、クラウド応用に関するものでとにかく日本で考えられる大規模データ処理を行っていそうな人をリストアップし参加してもらうことにしました。
Mobageの大規模データマイニングを紹介いただく濱田晃一(DeNA)さんから、統計数理の大御所、樋口知之(統計数理研)先生、金融系、消費者行動のモデリング、SNSデータ解析など考え付く一線の招待講演者を固めています。 最終日は、グーグルの栗原さん、楽天の森さんにもご参加いただき、機械学習気鋭の研究者杉山先生、web crawlingの鳥澤さん、PRMU委員長の山田さんのパネルで将来のWebスケール時代のデータ処理の方向性を議論します。
https://sites.google.com/site/bigdataandclould/
開催2日間を通じ、上記豪華メンバーが講演しています。Tweet まとめも以下に記載します。
PRMU研究会 −Big Data and Cloud:Webスケール時代のパターン認識−#PRMU - Togetter
学術・ビジネス連携、日本から世界への新たなサービス発信
今回、学術領域での講演を機会を頂け嬉しく思っています。セッション後や懇親会で、学術・ビジネス領域ともにたくさんの方々に声を掛けてもらえ、出会い、話すことができました。
楽しさのマイニングのユーザー体験還元。今後、世界中の人々へ対しても、それぞれの国民性・民族性にあった楽しさの提供。今後、学術・ビジネスお互い協力し、一緒に日本から世界へ新たなサービス発信をしていきたい。そう私は考えています。学術、ビジネス、双方の力を合わせて日本から世界へ。
最後に、招待講演の機会を下さったPRMU副委員長 NTTドコモの栄藤稔さん、私の各種調整を担当してく下さったパナソニックの石井育規さん、懇親会でたくさんの方々を紹介して下さった 中部大学の藤吉弘亘さん、ありがとうございました。統計数理研究所所長の樋口知之さんとも理論物理の博士つながりで今後のデータマイニングの展開に関し面白い議論をさせて頂けました。Googleの栗原賢一さんも博士時代の研究に統計物理に関する共通点があり機械学習、物理を超えて面白い議論をさせて頂きました。
今回の開催を通じ、出会い話し議論できたみなさんに感謝しています。ありがとうございました。今後ともよろしくお願い致します。
関連資料
- 『モバゲーの大規模データマイニング基盤におけるHadoop活用』−Hadoop Conference Japan 2011− #hcj2011
- 2100万会員モバゲータウンはデータマイニングの宝の山/Tech総研
- 「モバゲーの大規模データマイニング基盤におけるHadoop活用」−Hadoop Conference Japan 2011 #hcj2011 で登壇してきました - hamadakoichi blog
- Mahout JP を立ち上げました #MahoutJP - hamadakoichi blog
- Mahout JP - #TokyoWebmining 11th #MahoutJP
参考文献
- 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman
- 出版社/メーカー: Manning Pubns Co
- 発売日: 2011/10/28
- メディア: ペーパーバック
- クリック: 15回
- この商品を含むブログ (6件) を見る
- 作者: Tom White,玉川竜司,兼田聖士
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/07/23
- メディア: 大型本
- 購入: 5人 クリック: 22回
- この商品を含むブログ (11件) を見る
2011-11-27
■[Webmining][勉強会] 第16回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 16th)−リアルタイム分散 Web解析・自然言語処理 祭り− を開催しました

2011/11/27 "第16回 データマイニング+WEB 勉強会@東京−リアルタイム分散 Web解析・自然言語処理 祭り−"を開催しました。
- 第16回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 16th)−リアルタイム分散 Web解析・自然言語処理 祭り−: Eventbrite
- データマイニング+WEB@東京 (TokyoWebmining) | Google Groups
会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。
参加者ID・バックグラウンド一覧:
以下、全講師資料、関連資料、ツイートまとめです。
AGENDA:
■Opening Talk:
O1.「データマイニング+WEB勉強会@東京 について」(15分)
講師 : id:hamadakoichi @hamadakoichi
オープニングトーク − 創設の思い・目的・進行方針 −データマイニング+WEB勉強会@東京
O2.「参加者全員自己紹介」(75分)
進行 :@hamadakoichi
1.「Kafka によるリアルタイム分散処理」 (講師: @yanaoki ) (発表30分 + 議論30分)
リアルタイム分析が流行しつつあるなかで、先発のミドルウェアであるkafkaがどう設計・実装・応用されているかご紹介します。Hadoopとの連携に関しても紹介したいと思います。
- リアルタイム分散処理
- Facebook Insights
- Twitter
- Rainbird(ZooKeeper/Cassandra)
- Storm (Zookeeper)
- Google Analytics
- 非公開
- Linkedin
- Kafka (ZooKeeper)
- ランキング、関連情報
- 検索インデクスへ反映
- ユーザー数1億以上
- Kafka
- Kafkaの動作
2.「データマイニング現場 24時」 (講師: @kan_yukiko)(発表30分 + 議論30分)
Web解析・実際のデータマイニングの現場で行っている各種工夫をお話しします。ALBERTの最新分析事例や直感やひらめきの方法論、それらが重要な分析パターンも含め、赤裸々にお話しします。
- データマイニング現場
- レコメンドエンジン
- コンサルティング
- 大規模: 商品点数 80万〜100万点、ユーザー 400〜500万人
- 広告配信最適化のためのデータマイニング
- どのAdnetworkにどのタイミングで、どの広告を出していけばいいのか
- 超大規模データ、変数多数、リアルタイム性
- その他一切
- マーケティングリサーチ結果の分析
- レコメンドアルゴリズム等の研究開発
- 直観やひらめきを行うにはどうすればいいか
- 分析対象・データに対する理解を深める
- 分析手法についての理解
- 結果に対する判断力
- 想定外の結果が出たときにこそ、何かあるのではないか。
- 大胆に変える
- ソリューションとして提供できるか
- 事例紹介
- 買ってくれるお客さんはどんな人
- Frequency Monetery:ロイヤルカスタマー分析
- 「優良顧客になるきっかけになるアイテム」
- 顧客別の購入金額で上位 20%を優良とみなし、どのカテゴリを購入しているか
- 顧客別の購入金額で下位 20%が、どのカテゴリを購入しているか
- 購入タイミングの分析
- ライトタイムマーケティング
- 最適な顧客に最適商品を最適なタイミング・チャネルで送る。
- 過去の購入からこの秋になにが売れるかの流行を予測。
- 気づけた新カテゴリ:衛生商品が売れる。
- カテゴリごとに優良顧客定義。ステップアップを追うステップの区分は決め。
- 短期間に複数回購入されるカテゴリ
- 短期間に複数回購入のないカテゴリ
- ⇒それぞれに合う推薦方法
- データ分析ビジネス
- お客さまの課題
- データはあるが分析できない。
- データ量が多すぎる/分析者がいない/難しそう ⇒顧客分析、商品分析レポート
- 分析結果からのアクションが思いつかない ⇒分析結果の再検証、ソリューション提供
- 分析負荷が高いのでアウトソースしたい。
- データはあるが分析できない。
- 施策に活かされやすい分析
3「機械学習を使った英語習熟度の推定」 (講師: @langstat) (発表30分 + 議論30分)
所謂「英語力」のような言語習熟度の自動判定は、機械学習やパターン認識による分類問題に帰着します。ただ、その際に問題となるのは、どのような言語的特徴を素性として用いるかという点です。今回は、主に、談話表現に注目した分析例をご紹介します。
参考文献:
- 作者: シルヴィアン・グレンジャー,望月通子,船城道雄
- 出版社/メーカー: 研究社
- 発売日: 2008/02/28
- メディア: 単行本(ソフトカバー)
- クリック: 2回
- この商品を含むブログ (4件) を見る
- 作者: 金明哲
- 出版社/メーカー: 岩波書店
- 発売日: 2009/04/28
- メディア: 単行本
- 購入: 2人 クリック: 49回
- この商品を含むブログ (12件) を見る
- 研究の思い
- 習熟度の推定
- 文書と習熟度の教師データ
- コンテキストに応じた
- 学習者コーパス
- なにが変化していくか
- 説明変数(単語や文法項目の頻度など)を特定
- 結果変数(習熟度)を判定
- 英語科学論文、適切な表現が用いられているか
- Random Forestを用いた
4. 「テキストマイニングで発掘!?売上とユーザーレビューの相関分析」 (講師: @stakemura ) (発表30分 + 議論30分)
売上予測やニーズ分析に、非定型データであるクチコミを活用するのは大変難しい課題ですが、果敢に取り組んでいる研究もあります。今回は、そんな予測の要となる技術である評判分析について軽くお話します。
参考文献:
- 作者: 三室克哉,鈴村賢治,神田晴彦
- 出版社/メーカー: オーム社
- 発売日: 2007/05
- メディア: 単行本
- 購入: 1人 クリック: 5回
- この商品を含むブログ (3件) を見る
- 評判分析による予測
- 既存のタイトルがどのくらい伸びるか。ユーザーのレビュー情報のテキストマイニングから予測。
- 評判分析
- ある文章からこの文章が肯定的なのか否定的なのか判別する
- レイティングはバイアスが大きい。
- Sponge Bob Effect
- オスカーよりドラマのSponge Bobのレイティングが高い。認知度が低いものは、熱狂的な少数の人の好評価の影響を大きく受ける。
- OSSを活用し評判分析を行う
- 辞書作成を自動化する
- 採点済のユーザーレビューから、教師あり学習
- Lucene
- ベクトル空間モデル
- Naive Bayes vs 最大エントロピー法:
- Ngram: Unigram から 4-gram。Unigramが一番だった。Trigram以上がスパース過ぎた。
- どのキーワードが
- BM25
- ユーザーの複数評価
■声・議論:
D. 「参加者の声・ディスカッション」 (60分)
進行 : id:hamadakoichi @hamadakoichi
参加者全員での振返り結果MindMap
- 継続したい良かった点
- 改善点アクション
- 次回AGENDA
MindMap: 第16回データマイニング+WEB@東京継続したい点・改善点・次回AGENDA - XMind - Social Brainstorming and Mind Mapping
推薦文献
- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 11人 クリック: 241回
- この商品を含むブログ (45件) を見る
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 71人 クリック: 1,819回
- この商品を含むブログ (261件) を見る
関連ツイート(Togetter)
「第16回 データマイニング+WEB 勉強会@東京−リアルタイム分散 Web解析・自然言語処理 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)
第16回 データマイニング+WEB@東京 ( #TokyoWebmining #16)?リアルタイム分散 Web解析・自然言語処理 祭り? - Togetter
講師募集
データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の Twitter か Google Group へのメールへぜひご連絡下さい。
連絡先:
過去開催内容:
- 第15回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 15th)−統計・ビジネス活用 祭り− を開催しました - hamadakoichi blog
- 第14回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 14th)−大規模分散データマイニング 祭り− を開催しました - hamadakoichi blog
- 第13回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 13th)−Mahout・大規模解析・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第12回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り− を開催しました - hamadakoichi blog
- 第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) −Mahout・Graphical Model・学術 祭り−を開催しました - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −2nd Week−大規模分散 機械学習 祭り− - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −1st Week−広告ネットワーク・グラフ解析・並列機械学習 祭り− - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −2nd Week−方法論・ソーシャル祭り− を開催しました - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました - hamadakoichi blog
- 第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました - hamadakoichi blog
- 第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました - hamadakoichi blog
- 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました - hamadakoichi blog
- 第5回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#5) −WEB解析・最適化祭り−を開催しました - hamadakoichi blog
- 第4回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#4) −WEB祭り−を開催しました−「ソーシャルウェブ と レコメンデーション」 - hamadakoichi blog
- 第3回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#3) を開催しました−「R言語による クラスター分析 -活用編-」 - hamadakoichi blog
- 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」- - hamadakoichi blog
- 第1回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#1) を開催しました - 「はじめてでもわかる 統計解析・データマイニング R言語入門」 - hamadakoichi blog
2011-11-06
■[Webmining][勉強会] 第15回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 15th)−統計・ビジネス活用 祭り− を開催しました

2011/11/06 "第15回 データマイニング+WEB 勉強会@東京−統計・ビジネス活用 祭り−"を開催しました。
- 第15回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 15th)−大規模分散データマイニング 祭り−: Eventbrite
- データマイニング+WEB@東京 (TokyoWebmining) | Google Groups
会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。
参加者ID・バックグラウンド一覧:
以下、全講師資料、関連資料、ツイートまとめです。
AGENDA:
■Opening Talk:
O1.「データマイニング+WEB勉強会@東京 について」(15分)
講師 : id:hamadakoichi @hamadakoichi
オープニングトーク − 創設の思い・目的・進行方針 −データマイニング+WEB勉強会@東京
O2.「参加者全員自己紹介」(75分)
進行 :@hamadakoichi
1.「統計カリキュラム 第1回−一般化線形モデル−」 (講師: @isseing333) (発表30分 + 議論30分)
日本初の統計学部を目指して、統計学に関するトピックを網羅的にレクチャーしたいと思います。第一回は様々な場面で応用することができる一般化線形モデルについて発表します。
参考資料:
- 作者: Annette J.Dobson,田中豊,森川敏彦,山中竹春,冨田誠
- 出版社/メーカー: 共立出版
- 発売日: 2008/09/08
- メディア: 単行本
- 購入: 8人 クリック: 48回
- この商品を含むブログ (11件) を見る
- 予測精度が高くなるように、正則化項をいくつか試す
- 一般線形モデル(GLM)
- 一般化線形モデル (GLIM)
- 2値変数例
- サービス加入者が1か月以内に辞めるか(1)否か(0)
- ロジスティック回帰: 期待値にロジット変換。Logit(E[y])=βX
- はずれ値判定
- ?てこ比、?分散が均一か、?残差プロット
- うまくまとまらない場合は層を分ける
2.「医療分野におけるデータマイニングを始める前に知っておきたいこと (講師: @dichika)(発表20分 + 議論20分)
資料:「一般非公開で、希望者のみに配布」という形となります。配布希望の方は 講師 @dichika さんへご連絡下さい。
データマイニングは強力な武器ですが、「解くべき問題」をうまく設定して初めてその威力を発揮します。本発表では問題の設定につながるようなヒントを提示できればと思います。
関連資料:Big data: The next frontier for innovation, competition, and productivity (PDF)
- 施策が打てるか
- そもそも有効な対策
- 手順
- インパクト
- 目的を明確化する
- receipt = レシート。正式名称: 診療報酬明細書。
- 次の一手まで考える。
- 分析して意志決定がなされた後のニーズを考える。
- 施策ハイリスクな層から資源割当て。
- 実験計画の必要性。
3.「複雑ネットワークとデータマイニング 徹底入門」 (講師: @milionsmile) (発表30分 + 議論30分) (※USTREAM非公開)
複雑ネットワーク理論のビジネスへの応用について。次数分布、平均距離、クラスター係数、中心性などのネットワーク指標を用いることでどのようなデータ解析ができるのか概要をお話します。
参考文献:
- 作者: 増田直紀,今野紀雄
- 出版社/メーカー: 近代科学社
- 発売日: 2010/04/26
- メディア: 単行本
- 購入: 4人 クリック: 28回
- この商品を含むブログ (9件) を見る
- 作者: 増田直紀,今野紀雄
- 出版社/メーカー: 講談社
- 発売日: 2006/02/21
- メディア: 新書
- 購入: 6人 クリック: 34回
- この商品を含むブログ (70件) を見る
- 複雑ネットワークを用いると CTRが上がった事例がある
- 最近、グラフ構造と情報を合わせて解析される
- 本日は無向グラフ中心
- スモールワールド実験 -平均距離 (ミリグラム 1960年代)
- 平均距離 L ∝ LogN 的
- 6次の隔たりで、世界中の人々へ到達。
- クラスター係数: ノードi の友人どうしが友達である確率。
- 次数相関: エッジ
- 中心性
- コミュニティ構造
- モチーフ: グラフに含まれやすい三角形のパターン。
- ランダムネットワーク
- スケールフリーネットワーク
- 複雑ネットワーク
- 適用例
4. 「エンジニア向けマーケティングリサーチ入門」 (講師: @tetsuroito) (発表20分 + 議論20分)
資料:11/6 Tokyo Wemining Marketing Research for Engeenier by Tetsuro Ito on Prezi]
ビジネスで必要なマーケティング活動において、ソーシャルメディアの普及などでマーケティングリサーチの必要性が高まっています。基本的な概念や分析手法をエンジニアの方にもわかりやすくご紹介したいと思います。
参考文献:
- 作者: 萩原雅之
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2011/03/03
- メディア: 単行本
- 購入: 2人 クリック: 11回
- この商品を含むブログ (10件) を見る
- 作者: リサーチ・ナレッジ研究会,田中洋
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2010/08/06
- メディア: 単行本
- クリック: 18回
- この商品を含むブログ (4件) を見る
- Money Look
- 顧客にあった商品提供
- マーケティングリサーチの業界売上規模は横ばい
- Marketing 1.0/2.0/3.0
- 1.0: 商品中心
- 2.0: 顧客維持
- 3.0: Value Driven。製品価値を正しい人に届ける。
- インフルーエンサーの特定。適切なサービス・メッセージ配信。
- マーケティングの肝
- プロダクトアウト→マーケットインへ。
- 心がまえ
- 誰が何をするためのことを知りたいか
- 何がわかると自分たちはうれしいか
- 消費者や顧客を理解する方法も拡張が必要
- 次世代マーケティングリサーチ
- Marketing Research Online Community (MROC)
- 共感覚
- 行動心理学
5. 「2chのイカ娘スレッドを時系列分析してみた」 (講師: @gepuro) (発表20分+ 議論20分)
2ちゃんねるには、長い年月に渡って、同じテーマのスレッドが作られています。これらに対して、テキストマイニングのアプローチとして、時系列に分析してみました。
参考資料: JIN’S PAGE
- 月ごとの語の発生頻度推移・各種統計解析
■声・議論:
D. 「参加者の声・ディスカッション」 (60分)
進行 : id:hamadakoichi @hamadakoichi
参加者全員での振返り結果(継続したい良かった点、改善点、次回AGENDA)。
第15回データマイニング+WEB@東京継続したい点・改善点・次回AGENDA - XMind - Social Brainstorming and Mind Mapping
推薦文献
- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 11人 クリック: 241回
- この商品を含むブログ (45件) を見る
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 71人 クリック: 1,819回
- この商品を含むブログ (261件) を見る
関連ツイート(Togetter)
「第15回 データマイニング+WEB 勉強会@東京−統計・ビジネス活用祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)
第15回 データマイニング+WEB@東京 ( #TokyoWebmining #15)?統計・ビジネス活用 祭り? - Togetter
講師募集
データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の Twitter か Google Group へのメールへぜひご連絡下さい。
連絡先:
過去開催内容:
- 第14回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 14th)−大規模分散データマイニング 祭り− を開催しました - hamadakoichi blog
- 第13回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 13th)−Mahout・大規模解析・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第12回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り− を開催しました - hamadakoichi blog
- 第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) −Mahout・Graphical Model・学術 祭り−を開催しました - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −2nd Week−大規模分散 機械学習 祭り− - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −1st Week−広告ネットワーク・グラフ解析・並列機械学習 祭り− - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −2nd Week−方法論・ソーシャル祭り− を開催しました - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました - hamadakoichi blog
- 第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました - hamadakoichi blog
- 第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました - hamadakoichi blog
- 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました - hamadakoichi blog
- 第5回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#5) −WEB解析・最適化祭り−を開催しました - hamadakoichi blog
- 第4回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#4) −WEB祭り−を開催しました−「ソーシャルウェブ と レコメンデーション」 - hamadakoichi blog
- 第3回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#3) を開催しました−「R言語による クラスター分析 -活用編-」 - hamadakoichi blog
- 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」- - hamadakoichi blog
- 第1回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#1) を開催しました - 「はじめてでもわかる 統計解析・データマイニング R言語入門」 - hamadakoichi blog





