ブログトップ 記事一覧 ログイン 無料ブログ開設

hamadakoichi blog このページをアンテナに追加 RSSフィード Twitter

2015-01-24

[][] 第42回 データマイニング+WEB @東京( #TokyoWebmining 42nd ) −深層学習・表現学習 徹底活用 祭り−を開催しました  第42回 データマイニング+WEB @東京( #TokyoWebmining 42nd ) −深層学習・表現学習 徹底活用 祭り−を開催しましたを含むブックマーク  第42回 データマイニング+WEB @東京( #TokyoWebmining 42nd ) −深層学習・表現学習 徹底活用 祭り−を開催しましたのブックマークコメント

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20150124135506j:image

参加者Twitter List : tokyowebmining-42

参加者セキココ:第42回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@

O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1. 「深層学習時代の自然言語処理」(講師: @ ) (発表45分+議論45分)

自然言語処理に深層学習の波は来るのか。2014年自然言語処理界隈で流行した深層学習・表現学習系の主要なトピック、Skip-gramモデル (word2vec)、Paragraph Vector(paragraph2vec)、Recurrent Neural Network、Long Short-Term Memoryといったものを総ざらいし、応用的な観点言語学的な観点、実装的な観点から広く議論します。


2. 「ディープラーニング徹底活用 −画像認識編−」 (講師: @ )(発表30分+議論30分)

 人工知能研究におけるブレイクスルーとしてディープラーニングが注目を集めています。特に画像認識の分野で、たくさんの研究成果が報告されており、実際 にビジネスで活用する動きも出てきています。しかし、その利用はまだ一部の研究者だけに限られるものと思われている方も多いのではないでしょうか。今回は、実際の活用事例を紹介し、画像認識分野におけるディープラーニングがアイデアを実現するためのツールとして、比較的簡単に利用出来るということをお話 しします。活用事例の紹介は、ディープラーニングで作るアイドルグループ、月および火星表面の構造物探索などを予定しています。

参考文献:

Gradient-based learning applied to document recognition Y LeCun, L Bottou, Y Bengio, P Haffner Proceedings of the IEEE 86 (11), 2278-2324

Imagenet classification with deep convolutional neural networks A Krizhevsky, I Sutskever, GE Hinton Advances in neural information processing systems, 1097-1105

Decaf: A deep convolutional activation feature for generic visual recognition. J Donahue, Y Jia, O Vinyals, J Hoffman, N Zhang, E Tzeng, T Darrell.arXiv preprint arXiv:1310.1531

Rich feature hierarchies for accurate object detection and semantic segmentation. R Girshick, J Donahue, T Darrell, J Malik. arXiv preprint arXiv:1311.2524

Deep Learningに基づく画像認識を用いた月および火星表面の擬似不自然構造物探索, 栗原一貴, 笹尾和宏, 山本光穂, 田中秀樹, 奈良部隆行, 國吉雅人, 会田寅次郎, 岡田裕子, 高須正和, 関治之, 飯田哲, 山本博之, 生島高裕. エンターティンメントコンピューティング2014予稿集

ニューラルネットで画像分類(@rinzo_rinrinさん)

画像認識の初歩、SIFT、SURF特徴量(@lawmnさん)

セクシー女優で学ぶ画像分類入門(@tkm2261さん)


3. 「word2vecとは一体なんだったのか?」 (講師: @ )(発表30分+議論30分)

(※1/29追記: 上記資料、講師が資料補正検討中のため再公開、少々お待ちください。取り急ぎ、再公開まで、講師が同テーマで別会でTalkした別資料を掲載します。)

Word2vecのインプットとアウトプットを様々な可視化や集計と合わせてご紹介いたします。はたしてword2vecはマーケティングへの応用に耐えうるものなのでしょうか?乞うご期待下さい。

参考文献:

Word2vec配布サイト

Pythonへのword2vecバインディング

Word2vecによる自然言語処理

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

f:id:hamadakoichi:20150124194925j:image

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。


ツイートまとめ (Togetter)

「第42回 データマイニング+WEB @東京 ( #TokyoWebmining 42nd ) −深層学習・表現学習 徹底活用 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:


■関連エントリ:

■講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

Wiki


■過去開催内容:

2014-12-20

[][] 第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しました  第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しましたを含むブックマーク  第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しましたのブックマークコメント

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20141220134345j:image

参加者セキココ:第41回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@

O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1. 「生命情報のデータマイニング 」(講師: @ )(発表30分+議論40分)

演者は2000年ごろから生命情報のデータマイニングに着手し、

SVMやRandom Forestsなどの機械学習を用いて課題解決に取り組んできました。

今回はそれらの概略を紹介できればと考えています。

参考文献:

http://web.stanford.edu/~hastie/Papers/ESLII.pdf


2.「状態空間モデルによるモデリング徹底入門」 (講師: @ )(発表25分+議論35分)

時系列で変化する観測値について、観測値だけより、時系列で変化する内部状態を仮定して内部状態から観測値を説明するモデルができたらスッキリする場合が多々ある。

(表に出ない嫁の機嫌はどのように時系列変化して、食事の内容がどのように変わるか等?)

このような数理モデルに状態空間モデルがあるが、制御工学の理論として発展してきたもので文系には難解な部分もある。

この魅力的にも思えるモデリング手法について、まずはその考え方やどのように使えば良いか・その限界等を入門者の立場から発表する。

参考文献:

時系列解析入門

時系列解析入門

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

カルマンフィルタの基礎

カルマンフィルタの基礎

はじめての現代制御理論 (KS理工学専門書)

はじめての現代制御理論 (KS理工学専門書)


3.「フリーソフトウェア「KH Coder」を使った計量テキスト分析―手軽なマウス操作による分析からプラグイン作成まで」 (講師: @ )(発表30分+議論40分)

KH Coderとはテキストマイニング(内容分析)のためのフリーソフトウェアです。

内部では茶筌・MeCabMySQL+Rを利用しており、これらのツールの機能を統合するためにPerlを使っています。

当日はアンケート自由回答の分析事例を通じて、KH Coderの分析機能をご紹介します。

また、非常に手軽なマウス操作でそうした分析が可能なことを、実際にソフトを動かしてのデモからご覧いただきます。

加えて、ごくわずかなPerlとRのコードを書くことで、新たな分析機能を追加したり、分析を自動化したりできる、プラグイン機構についてお話しいたします。

参考文献:

樋口耕一, 2001-2014, 「KH Coder」 .

コーパスとテキストマイニング

コーパスとテキストマイニング

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。



ツイートまとめ (Togetter)

「第41回 データマイニング+WEB @東京 ( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:



過去開催内容:

2014-11-29

[][] 第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) − ソーシャル最適化 祭り −を開催しました  第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) − ソーシャル最適化 祭り −を開催しましたを含むブックマーク  第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) − ソーシャル最適化 祭り −を開催しましたのブックマークコメント

2014/11/29 "第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) −ソーシャル最適化 祭り−" を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20141129133842j:image

参加者Twitter List : tokyowebmining-40

参加者セキココ:第40回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1. 「バイラルメディア可視化 拡大版」 (@ )(発表30分+議論40分)

近年、急成長しているメディアの形式として「バイラルメディア」があります。

バイラルメディアとは、インターネット上でウィルスのように伝搬しやすいように作られたコンテンツです。

本発表は国内のバイラルメディアからコンテンツを収集し、バイラルされやすいコンテンツにはどういった特徴があるか自然言語処理等を技術を活用して分析した結果について発表します。

PyConJP2014のライトニングトークの拡大版です。

参考文献:

バイラルメディアの可視化


2. 「オークションの理論と実証入門」 (講師: @)(発表25分+議論35分)

ECのみならず広告や、金融など様々な場所で活用されているオークション。

経済学の世界では「ゲーム理論の実証分析」としては最も成功した例の一つとしても知られています。

今回はインターネットオークションに焦点を当て、経済理論がどのようにデータ分析の役に立つのかをご紹介できればと思います。

理論の概要や分析方法・結果、歴史なども織り交ぜてお話します。

参考文献:

オークションの人間行動学

オークションの人間行動学

Auction Theory, Second Edition

Auction Theory, Second Edition

Bajari, P. and Hortacsu, A. (2004) ”Economic Insights from Internet Auctions” Journal of Economic Literature, Vol. XLII, 457-486

ブライアン・リアマウント (1993) オークションの社会史−人身売買から絵画取引まで 高科書店



3.「最適化超入門」 (講師: @ )(発表30分+議論40分)

最適化について、全体的な話を語ります。『最適化したい!』と思った時に、最初に参考になるものになれればと思います。Scipyに実装されているものを優先的に紹介し、帰ったらすぐ動かせるよう心がける予定です。

また、組合せ最適化の実務的な話も出来ればと思っています。

トピック

制約なし連続最適化 : ニュートン法最急降下法共役勾配法シンプレックス法 etc.

制約あり連続最適化 : 単体法、内点法

組合せ最適化 : メタ解法(遺伝的アルゴリズムタブーサーチ等)、混合整数計画ソルバー(Gurobi、CBC等)

ります


追記 : 最適化計算 実装:

https://github.com/anaguma2261/TokyoWebmining_40_tkm2261

参考文献:

応用数理計画ハンドブック

応用数理計画ハンドブック

メタヒューリスティクスの数理

メタヒューリスティクスの数理

小島 政和, 笹島 和幸, 天谷 賢治, 福田 光浩. 『計算機支援数理』.

Link: http://www.ocw.titech.ac.jp/index.php?module=General&action=T0300&GakubuCD=226&GakkaCD=226715&KougiCD=75001&Nendo=2011&Gakki=2⟨=JA&vid=05



■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

f:id:hamadakoichi:20141129185819j:image

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。



ツイートまとめ (Togetter)

「第40回 データマイニング+WEB @東京 ( #TokyoWebmining 40th ) −ソーシャル最適化 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)



講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:



過去開催内容:

2014-10-11

[][] 第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) − 捗る機械学習自然言語処理 祭り − を開催しました  第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) − 捗る機械学習・自然言語処理 祭り − を開催しましたを含むブックマーク  第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) − 捗る機械学習・自然言語処理 祭り − を開催しましたのブックマークコメント

2014/10/11 "第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) −捗る機械学習自然言語処理 祭り−"を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20141011182637j:image

参加者Twitter List : tokyowebmining-39

参加者セキココ:第39回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

1. 「広告領域における機械学習活用: CVR予測最前線」 (@)(発表30分+議論40分)

近年オンライン広告においてはRTBの普及により1impressionあたりの価値を正確に予測する必要性があり、また広告領域においては大量のログデータが存在する。

このため広告領域においては大量のログデータから広告を表示した際のCTR, CVRの予測に機械学習を利用する研究がいくつもなされている。

本発表では今年の8月に行われたKDD 2014の広告関連のワークショップのADKDD2014で発表されたFacebookでの広告のCTR予測手法を中心に機械学習と広告領域の応用について発表する。

参考文献:


2. 「捗るリコメンドシステムの裏事情」 (講師: @)(発表25分+議論35分)

2014年夏コミに合わせてリリースされた、君にシンクロするニュースアプリ「ハッカドール」。

ハッカドールちゃんがオタク用の記事を拾ってくれるサービスで、開発陣の並々ならぬ情熱によって作られたアプリ

今回はその裏側のリコメンドシステムを紹介します。

オタクドメインを絞ると何が起こるのか?ニッチな話がてんこもりです。

参考文献:

3.「マーケティングサイエンス徹底入門と実践 Part2 : 購買行動徹底分析」 (講師: @sanoche16 )(発表30分+議論40分)

市場分析・価格分析・顧客分析など、企業を支えるマーケティングサイエンスに関する発表Part2です。今回は顧客の購買行動に焦点をあて、顧客に刺さるものづくりPDCAをまわす上で強烈なインプリケーションを出す様々な分析について、入門的トピックから徹底的に語ります。

参考文献:

マーケティング・モデル (Rで学ぶデータサイエンス 13)

マーケティング・モデル (Rで学ぶデータサイエンス 13)

Discrete Choice Methods with Simulation

Discrete Choice Methods with Simulation


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

f:id:hamadakoichi:20141011194941j:image

発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第39回 データマイニング+WEB@東京( #TokyoWebmining 39th )−マーケティング分析活用最前線 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)


講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:


過去開催内容:

2014-07-26

[][] 第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り− を開催しました  第38回 データマイニング+WEB@東京( #TokyoWebmining 38th )  −マーケティング分析活用最前線 祭り− を開催しましたを含むブックマーク  第38回 データマイニング+WEB@東京( #TokyoWebmining 38th )  −マーケティング分析活用最前線 祭り− を開催しましたのブックマークコメント

2014/7/26 "第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20140726192235j:image

参加者Twitter List : tokyowebmining-38

参加者セキココ:第38回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

1.「ここでしか聞けない! マーケティング分析実践編」(講師: @ )(発表30分 + 議論40分) (UST: 公開、資料: 非公開)

日用消費財メーカーのマーケティング部門で行っている分析事例をお話しします。

日用消費財は生活に欠かせない比較的安価な製品が多く、衝動買いといった非計画購買される割合が高いことが特徴です。またインターネット販売が当たり前になった現在でも流通額の多くは実店舗が占めています。

今回の発表では10年前に社内SEからマーケティング部門の分析担当者になったスピーカーが実践・経験したマーケティングPDCAについて赤裸々にお話しします。


2.「マスマーケティングにおける広告・販促施策の効果検証について」 (講師: @)(発表20分 + 議論30分) (UST:公開、資料: 部分公開)

マスマーケティングにおける広告・販促施策効果測定方法について、一般的に良く用いられる手法の一つである「マーケティングミックスモデリング」を中心に、(勉強中の内容も含め)お話しさせて頂きます。WEBマーケティングやダイレクトマーケティングと異なり、個人の購買や広告接触のトラッキングが困難な、マスマーケティングの世界で、どのような取り組みが行われているかを少しでもお伝えできたら幸いです。

参考文献:

ROI入門 

MarketingMixModeling(Wikipedia)



3. アンカンファレンス

進行説明 (5分) ( 進行: @


Topic LT(計15分:)/チーム分散(5分)/チーム内議論 (30分) /各チーム発表(計15分)
Topic 1.「Webスクレイピングのセーフ or Not」(講師: @)

Webスクレイピングの法律問題を話し合いませんか?Webスクレイピングする時、その解析結果を公表する時、訴えられる心配をしてしまいます。その心配をなくす為に、合法/違法の境界線を話し合いましょう。

参考資料

議論ホワイトボード

f:id:hamadakoichi:20140726175234j:image

Topic 2.「お金の儲かる機械学習」(講師: @ )

f:id:hamadakoichi:20140726231120p:image:h350

資料:お金の儲かる機械学習

「お金の儲かる機械学習」では、金融現象の予測に機械学習が利用できるかどうか?ということについて検討したいと思います。利用する情報や投資対象の性質を元に、皆さんで現実的かどうかを考えましょう。

参考資料

議論ホワイトボード

f:id:hamadakoichi:20140726175345j:image

Topic 3.「ビジネスにおけるデータビジュアリゼーション」(講師: @)

高度な分析をどう伝えていくのか、浸透させていくのかは分析を行う上でも大きな課題です。D3.js、Tableau等、データを可視化する環境が整っている中、ビジュアリゼーション領域、ダッシュボード作成が極めて活発になっています。皆さんが誰に対して、どのような目的で、どのような体制でデータの可視化を行っているのか議論したいと思っています。

参考資料

Information Dashboard Design: Displaying data for at-a-glance monitoring

Information Dashboard Design: Displaying data for at-a-glance monitoring

議論ホワイトボード

f:id:hamadakoichi:20140726175707j:image


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第38回 データマイニング+WEB@東京( #TokyoWebmining 38th )−マーケティング分析活用最前線 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)


講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:


過去開催内容: