ブログトップ 記事一覧 ログイン 無料ブログ開設

hamadakoichi blog このページをアンテナに追加 RSSフィード Twitter

2014-12-20

[][] 第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しました  第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しましたを含むブックマーク  第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しましたのブックマークコメント

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20141220134345j:image

参加者セキココ:第41回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@

O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1. 「生命情報のデータマイニング 」(講師: @ )(発表30分+議論40分)

演者は2000年ごろから生命情報のデータマイニングに着手し、

SVMやRandom Forestsなどの機械学習を用いて課題解決に取り組んできました。

今回はそれらの概略を紹介できればと考えています。

参考文献:

http://web.stanford.edu/~hastie/Papers/ESLII.pdf


2.「状態空間モデルによるモデリング徹底入門」 (講師: @ )(発表25分+議論35分)

時系列で変化する観測値について、観測値だけより、時系列で変化する内部状態を仮定して内部状態から観測値を説明するモデルができたらスッキリする場合が多々ある。

(表に出ない嫁の機嫌はどのように時系列変化して、食事の内容がどのように変わるか等?)

このような数理モデルに状態空間モデルがあるが、制御工学の理論として発展してきたもので文系には難解な部分もある。

この魅力的にも思えるモデリング手法について、まずはその考え方やどのように使えば良いか・その限界等を入門者の立場から発表する。

参考文献:

時系列解析入門

時系列解析入門

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

カルマンフィルタの基礎

カルマンフィルタの基礎

はじめての現代制御理論 (KS理工学専門書)

はじめての現代制御理論 (KS理工学専門書)


3.「フリーソフトウェア「KH Coder」を使った計量テキスト分析―手軽なマウス操作による分析からプラグイン作成まで」 (講師: @ )(発表30分+議論40分)

KH Coderとはテキストマイニング(内容分析)のためのフリーソフトウェアです。

内部では茶筌・MeCabMySQL+Rを利用しており、これらのツールの機能を統合するためにPerlを使っています。

当日はアンケート自由回答の分析事例を通じて、KH Coderの分析機能をご紹介します。

また、非常に手軽なマウス操作でそうした分析が可能なことを、実際にソフトを動かしてのデモからご覧いただきます。

加えて、ごくわずかなPerlとRのコードを書くことで、新たな分析機能を追加したり、分析を自動化したりできる、プラグイン機構についてお話しいたします。

参考文献:

樋口耕一, 2001-2014, 「KH Coder」 .

コーパスとテキストマイニング

コーパスとテキストマイニング

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。



ツイートまとめ (Togetter)

「第41回 データマイニング+WEB @東京 ( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:



過去開催内容:

2014-11-29

[][] 第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) − ソーシャル最適化 祭り −を開催しました  第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) − ソーシャル最適化 祭り −を開催しましたを含むブックマーク  第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) − ソーシャル最適化 祭り −を開催しましたのブックマークコメント

2014/11/29 "第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) −ソーシャル最適化 祭り−" を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20141129133842j:image

参加者Twitter List : tokyowebmining-40

参加者セキココ:第40回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1. 「バイラルメディア可視化 拡大版」 (@ )(発表30分+議論40分)

近年、急成長しているメディアの形式として「バイラルメディア」があります。

バイラルメディアとは、インターネット上でウィルスのように伝搬しやすいように作られたコンテンツです。

本発表は国内のバイラルメディアからコンテンツを収集し、バイラルされやすいコンテンツにはどういった特徴があるか自然言語処理等を技術を活用して分析した結果について発表します。

PyConJP2014のライトニングトークの拡大版です。

参考文献:

バイラルメディアの可視化


2. 「オークションの理論と実証入門」 (講師: @)(発表25分+議論35分)

ECのみならず広告や、金融など様々な場所で活用されているオークション。

経済学の世界では「ゲーム理論の実証分析」としては最も成功した例の一つとしても知られています。

今回はインターネットオークションに焦点を当て、経済理論がどのようにデータ分析の役に立つのかをご紹介できればと思います。

理論の概要や分析方法・結果、歴史なども織り交ぜてお話します。

参考文献:

オークションの人間行動学

オークションの人間行動学

Auction Theory, Second Edition

Auction Theory, Second Edition

Bajari, P. and Hortacsu, A. (2004) ”Economic Insights from Internet Auctions” Journal of Economic Literature, Vol. XLII, 457-486

ブライアン・リアマウント (1993) オークションの社会史−人身売買から絵画取引まで 高科書店



3.「最適化超入門」 (講師: @ )(発表30分+議論40分)

最適化について、全体的な話を語ります。『最適化したい!』と思った時に、最初に参考になるものになれればと思います。Scipyに実装されているものを優先的に紹介し、帰ったらすぐ動かせるよう心がける予定です。

また、組合せ最適化の実務的な話も出来ればと思っています。

トピック

制約なし連続最適化 : ニュートン法最急降下法共役勾配法シンプレックス法 etc.

制約あり連続最適化 : 単体法、内点法

組合せ最適化 : メタ解法(遺伝的アルゴリズムタブーサーチ等)、混合整数計画ソルバー(Gurobi、CBC等)

ります


追記 : 最適化計算 実装:

https://github.com/anaguma2261/TokyoWebmining_40_tkm2261

参考文献:

応用数理計画ハンドブック

応用数理計画ハンドブック

メタヒューリスティクスの数理

メタヒューリスティクスの数理

小島 政和, 笹島 和幸, 天谷 賢治, 福田 光浩. 『計算機支援数理』.

Link: http://www.ocw.titech.ac.jp/index.php?module=General&action=T0300&GakubuCD=226&GakkaCD=226715&KougiCD=75001&Nendo=2011&Gakki=2⟨=JA&vid=05



■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

f:id:hamadakoichi:20141129185819j:image

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。



ツイートまとめ (Togetter)

「第40回 データマイニング+WEB @東京 ( #TokyoWebmining 40th ) −ソーシャル最適化 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)



講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:



過去開催内容:

2014-10-11

[][] 第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) − 捗る機械学習自然言語処理 祭り − を開催しました  第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) − 捗る機械学習・自然言語処理 祭り − を開催しましたを含むブックマーク  第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) − 捗る機械学習・自然言語処理 祭り − を開催しましたのブックマークコメント

2014/10/11 "第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) −捗る機械学習自然言語処理 祭り−"を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20141011182637j:image

参加者Twitter List : tokyowebmining-39

参加者セキココ:第39回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

1. 「広告領域における機械学習活用: CVR予測最前線」 (@)(発表30分+議論40分)

近年オンライン広告においてはRTBの普及により1impressionあたりの価値を正確に予測する必要性があり、また広告領域においては大量のログデータが存在する。

このため広告領域においては大量のログデータから広告を表示した際のCTR, CVRの予測に機械学習を利用する研究がいくつもなされている。

本発表では今年の8月に行われたKDD 2014の広告関連のワークショップのADKDD2014で発表されたFacebookでの広告のCTR予測手法を中心に機械学習と広告領域の応用について発表する。

参考文献:


2. 「捗るリコメンドシステムの裏事情」 (講師: @)(発表25分+議論35分)

2014年夏コミに合わせてリリースされた、君にシンクロするニュースアプリ「ハッカドール」。

ハッカドールちゃんがオタク用の記事を拾ってくれるサービスで、開発陣の並々ならぬ情熱によって作られたアプリ

今回はその裏側のリコメンドシステムを紹介します。

オタクドメインを絞ると何が起こるのか?ニッチな話がてんこもりです。

参考文献:

3.「マーケティングサイエンス徹底入門と実践 Part2 : 購買行動徹底分析」 (講師: @sanoche16 )(発表30分+議論40分)

市場分析・価格分析・顧客分析など、企業を支えるマーケティングサイエンスに関する発表Part2です。今回は顧客の購買行動に焦点をあて、顧客に刺さるものづくりPDCAをまわす上で強烈なインプリケーションを出す様々な分析について、入門的トピックから徹底的に語ります。

参考文献:

マーケティング・モデル (Rで学ぶデータサイエンス 13)

マーケティング・モデル (Rで学ぶデータサイエンス 13)

Discrete Choice Methods with Simulation

Discrete Choice Methods with Simulation


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

f:id:hamadakoichi:20141011194941j:image

発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第39回 データマイニング+WEB@東京( #TokyoWebmining 39th )−マーケティング分析活用最前線 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)


講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:


過去開催内容:

2014-07-26

[][] 第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り− を開催しました  第38回 データマイニング+WEB@東京( #TokyoWebmining 38th )  −マーケティング分析活用最前線 祭り− を開催しましたを含むブックマーク  第38回 データマイニング+WEB@東京( #TokyoWebmining 38th )  −マーケティング分析活用最前線 祭り− を開催しましたのブックマークコメント

2014/7/26 "第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20140726192235j:image

参加者Twitter List : tokyowebmining-38

参加者セキココ:第38回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

1.「ここでしか聞けない! マーケティング分析実践編」(講師: @ )(発表30分 + 議論40分) (UST: 公開、資料: 非公開)

日用消費財メーカーのマーケティング部門で行っている分析事例をお話しします。

日用消費財は生活に欠かせない比較的安価な製品が多く、衝動買いといった非計画購買される割合が高いことが特徴です。またインターネット販売が当たり前になった現在でも流通額の多くは実店舗が占めています。

今回の発表では10年前に社内SEからマーケティング部門の分析担当者になったスピーカーが実践・経験したマーケティングPDCAについて赤裸々にお話しします。


2.「マスマーケティングにおける広告・販促施策の効果検証について」 (講師: @)(発表20分 + 議論30分) (UST:公開、資料: 部分公開)

マスマーケティングにおける広告・販促施策効果測定方法について、一般的に良く用いられる手法の一つである「マーケティングミックスモデリング」を中心に、(勉強中の内容も含め)お話しさせて頂きます。WEBマーケティングやダイレクトマーケティングと異なり、個人の購買や広告接触のトラッキングが困難な、マスマーケティングの世界で、どのような取り組みが行われているかを少しでもお伝えできたら幸いです。

参考文献:

ROI入門 

MarketingMixModeling(Wikipedia)



3. アンカンファレンス

進行説明 (5分) ( 進行: @


Topic LT(計15分:)/チーム分散(5分)/チーム内議論 (30分) /各チーム発表(計15分)
Topic 1.「Webスクレイピングのセーフ or Not」(講師: @)

Webスクレイピングの法律問題を話し合いませんか?Webスクレイピングする時、その解析結果を公表する時、訴えられる心配をしてしまいます。その心配をなくす為に、合法/違法の境界線を話し合いましょう。

参考資料

議論ホワイトボード

f:id:hamadakoichi:20140726175234j:image

Topic 2.「お金の儲かる機械学習」(講師: @ )

f:id:hamadakoichi:20140726231120p:image:h350

資料:お金の儲かる機械学習

「お金の儲かる機械学習」では、金融現象の予測に機械学習が利用できるかどうか?ということについて検討したいと思います。利用する情報や投資対象の性質を元に、皆さんで現実的かどうかを考えましょう。

参考資料

議論ホワイトボード

f:id:hamadakoichi:20140726175345j:image

Topic 3.「ビジネスにおけるデータビジュアリゼーション」(講師: @)

高度な分析をどう伝えていくのか、浸透させていくのかは分析を行う上でも大きな課題です。D3.js、Tableau等、データを可視化する環境が整っている中、ビジュアリゼーション領域、ダッシュボード作成が極めて活発になっています。皆さんが誰に対して、どのような目的で、どのような体制でデータの可視化を行っているのか議論したいと思っています。

参考資料

Information Dashboard Design: Displaying data for at-a-glance monitoring

Information Dashboard Design: Displaying data for at-a-glance monitoring

議論ホワイトボード

f:id:hamadakoichi:20140726175707j:image


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第38回 データマイニング+WEB@東京( #TokyoWebmining 38th )−マーケティング分析活用最前線 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)


講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:


過去開催内容:

2014-06-21

[][] 第37回 データマイニング+WEB@東京( #TokyoWebmining 37th ) −広告配信最適化・実運用 祭り− を開催しました  第37回 データマイニング+WEB@東京( #TokyoWebmining 37th )  −広告配信最適化・実運用 祭り− を開催しましたを含むブックマーク  第37回 データマイニング+WEB@東京( #TokyoWebmining 37th )  −広告配信最適化・実運用 祭り− を開催しましたのブックマークコメント

2014/6/21 "第37回 データマイニング+WEB@東京( #TokyoWebmining 37th ) −広告配信最適化・実運用 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20140621135727j:image

参加者セキココ:第37回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

T1. 各TRY 状況報告 (※Kimさん 急遽予定入り前半しか参加できなくなったため、前半に移動しました)

ハッカソンに関して(@haegwankim ): 5分


1.「マルコフ連鎖モデルによるアトリビューション分析(インターネット広告への応用)(講師: @ )(発表20分 + 議論40分)

インターネット広告は運用が柔軟にできるため、速やかな投資判断が可能です。投資判断をするためには、広告に対して評価指標が必要です。従来の評価方法では、売り上げに対してラスト接触の広告に対してのみ、成果ポイントがつくような評価指標でした。その中で「ラスト接触の広告以外にも適切な評価をして、適切な投資判断などをしようという試み」が生まれ、アトリビューション分析と呼ばれています。

現在、この分析に定型はなく、各企業でバリエーションがあります。このトークでは、比較的一般的な手法を紹介した後、マルコフ連鎖モデルによる手法を紹介します。数学的な構造や、他分野での展開を含めて議論できればと思います。

参考文献:


2.「経路積分から眺める確率過程」(講師: @ ) (発表25分 + 議論40分)

確率過程を扱う手法の一つとして、素粒子物理学で開発された経路積分と呼ばれる手法が存在します。経路積分はもともと素粒子の相互作用を計算するのに活用されていましたが、次第に金融などの諸分野へ応用されるようになってきています。本発表では経路積分の概念の簡単な説明とその応用について紹介します。

推薦文献:

ゲージ場の量子論〈1〉 (新物理学シリーズ)

ゲージ場の量子論〈1〉 (新物理学シリーズ)



3. アンカンファレンス

進行説明 (5分) ( 進行: @ -> @


Topic LT(計15分:)/チーム分散(5分)/チーム内議論 (30分) /各チーム発表(計15分)
Topic 1.「ビジネスレベルでの自然言語処理〜葛藤と現実〜」 (講師: @)

テキストマイニングサーチエンジン、感情分析、評判分析、オントロジー)が注目されるなか、 実際のビジネスレベルではどのように自然言語処理が活用されているのをメイントピックとさせていただきます。

アカデミックレベルではなく、ビジネスレベルでいかに自然言語処理と向き合っているのか、バックグラウンドを持った方々は、どのように業務で自然言語処理に携わっているのかなど、自社サービス意外の言語処理活用事例などの情報交換などもふまえたビジネスレベルでの自然言語処理について議論したいと思います。

議論ホワイトボード

f:id:hamadakoichi:20140621175710j:image


Topic 2.「ユーザー分析における特徴量(変数)の作り方について」(講師: @)

分析を行う際には、対象を表現する量を『つくる』→『捨てる/まとめる』→『分析に投げる』の作業がついて回るかと思います。この『つくる』と『捨てる/まとめる』についてどんな工夫があるかについて議論したいと思います。

議論ホワイトボード

f:id:hamadakoichi:20140621175834j:image

Topic 3. 「B2Bデータ運用の悩み〜葛藤と現実〜」(講師: @)

※資料効果され次第、追記します。

法人のデータの汚い原因・事象・何故汚くなるかを共有します。皆さんがどのようにB2B法人顧客データを扱っているか、どのように扱えば、よりよい分析・運用が出来るのかを議論したいと思います。

議論ホワイトボード

f:id:hamadakoichi:20140621190016j:image


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード

f:id:hamadakoichi:20140621193409j:image

※発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第37回 データマイニング+WEB@東京( #TokyoWebmining 37th )−広告配信最適化・実運用 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

懇親会(ピザパーティ)

懇親会で前回からホワイトボードも用意し、ピザを食べ・お酒を飲みながら、ホワイトボードを用い議論できるようにしています。

懇親会ホワイトボード写真も共有します。

f:id:hamadakoichi:20140621214639j:image

f:id:hamadakoichi:20140621212602j:image

推薦文献

広告関連:
自然言語処理関連:
入門 自然言語処理

入門 自然言語処理

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)



講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:


過去開催内容: