ブログトップ 記事一覧 ログイン 無料ブログ開設

hamadakoichi blog このページをアンテナに追加 RSSフィード Twitter

2016-01-16

[][] 第50回 データマイニング+WEB @東京( #TokyoWebmining 50th ) ー機械学習 実活用 祭りーを開催しました  第50回 データマイニング+WEB @東京( #TokyoWebmining 50th ) ー機械学習 実活用 祭りーを開催しましたを含むブックマーク  第50回 データマイニング+WEB @東京( #TokyoWebmining 50th ) ー機械学習 実活用 祭りーを開催しましたのブックマークコメント

2015/1/16 "第50回 データマイニング+WEB @東京( #TokyoWebmining 50th ) ー機械学習 実活用 祭りー" を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20160116162154j:image

参加者セキココ:第50回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@



O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1.「データ・機械学習活用 アンカンファレンス」(進行: : @)


アンカンファレンスとは、参加者が自分の議論したいトピックに関して話し、参加者が全員で議論・課題解決を行い、作りあげるカンファレンスです。TokyoWebmining には、データ・機械学習の各領域での実活用を行っているメンバーが集まっています。日頃、議論したいトピックをぜひ議論しましょう。

進行:

ホワイトボード写真
1. "Deep Learning" Team

f:id:hamadakoichi:20160116145352j:image

2. "機械学習" Team

f:id:hamadakoichi:20160116150350j:image

3."機械学習 + Deep Learning" Team

f:id:hamadakoichi:20160116161833j:image



2. 「子どもたちの未来を支える機械学習」(講師: @) (発表:20分+議論:30分)

PCBs, Dioxinなどを始めとする有機ハロゲン化合物は、胎盤を通じて母体から胎児へ移行することが知られている。これらの化学物質は脳神経系の発達に悪影響をおよぼすことが報告されており、発生初期の曝露による胎児への影響が懸念されている。 既報により、母体血清中・臍帯血清中の有機ハロゲン化合物の濃度間には相関関係が認められ、化学物質ごとに母子間移行率が異なることが明らかになっている。

しかし、これら化合物の母子間移行率の差がどのような物理化学特性に基づいているかを研究した例は限られている。

本研究では定量的構造物性相関(QSPR) により得た有機ハロゲン化合物の物理化学特性と母子間移行率の関係を解析し、母子間移行率に関与する化学物質の物理化学的性質の特定を試みた。

参考文献:


3. 「パーソナル広告配信徹底入門」 (講師: @yskn67 ) (発表: 30分+議論: 40分)

インターネット上での広告表示はRTB (Real Time Bidding) の登場により、広告枠に対して表示する方法から人に対して表示する方法にシフトしています。

本発表ではRTBの基本的な概念からアナリティクスの使いどころについてご紹介します。

特に、ダイナミックリターゲティングと呼ばれるパーソナライズされたバナー広告について詳しくご紹介しようと思います。

参考文献:


各種トピック・議論

  • ダイナミックリターゲティング狙い
    • サイトへの来訪
    • 適合率。Serendipityより。
  • ダイナミックリターゲティングでのアルゴリズム
    • 協調フィルタ的なサービスが多い
    • ランキング:総合、カテゴリごと、も。
  • 広告主
    • EC、人材、旅行、など。
  • 評価指標
    • CTR, CVR でABテスト
  • 広告ターゲティングに効く特徴量選択、どのようにやると効果高いか
    • 影響度を見る。選択もABテストで決める。
  • 体制議論
    • 機械学習のモデル設計からサービス適用の実装まで同じメンバーが担当している企業が多い
  • creteo が他のリターゲティング業者を倒した理由
    • リタゲ反映が早い。ブラウザバックでもう反映されている。


ツイートまとめ (Togetter)

「第50回 データマイニング+WEB @東京( #TokyoWebmining 50th ) ー機械学習 実活用 祭りー」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:


■講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

Wiki


振返り:

振返りホワイトボード(Keep/Try/Talk候補):

f:id:hamadakoichi:20160116191216j:image

2015-10-24

[][] 第49回 データマイニング+WEB @東京( #TokyoWebmining 49th ) ー機械学習 方法論 祭りーを開催しました  第49回 データマイニング+WEB @東京( #TokyoWebmining 49th ) ー機械学習 方法論 祭りーを開催しましたを含むブックマーク  第49回 データマイニング+WEB @東京( #TokyoWebmining 49th ) ー機械学習 方法論 祭りーを開催しましたのブックマークコメント

2015/10/24 "第49回 データマイニング+WEB @東京( #TokyoWebmining 49th ) ー機械学習 方法論 祭りー" を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20151024134802j:image

参加者Twitter List : tokyowebmining-48

参加者セキココ:第49回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@

O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1.「統計分析・機械学習に関わる線形代数の整理」(講師: @ )(発表:20分+議論:25分)

統計分析や機械学習には、その理論の記述に線形代数が使用されることがよくある。

そして数式のそもそもの意味や概念をあまり知らない為に理解し難いこともある。

今回は線形代数の基本的な概念に関して直感的な理解を整理してまとめる。

参考文献:

2. 「階層ディリクレ過程とマルコフ確率場を利用した教師なし画像領域分割」 (講師: @ ) (発表:40分+議論:50分)

階層ディリクレ過程を事前分布とした確率モデルは、

「グループごとのばらつきを吸収する」階層ベイズモデルとしての能力と

「モデルの複雑さをデータから自動決定する」ノンパラメトリックモデルとしての能力の両方を獲得します。

本発表では、教師なし画像領域分割を例に、階層ディリクレ過程と画像データセットのモデル化について紹介します。

また、実問題への応用についてもディスカッションできればと思います。

参考文献:

Session で挙がった見るべき文献:

3. 「深層学習ライブラリの現在」 (講師: @ ) (発表:30分+議論:35分)

雨後の筍のように出てくる深層学習における計算機フレームワークライブラリについて,

それぞれの設計思想の差や具体的なコード実装のやりやすさや将来性などを比較検討します.

比較対象にするのは,Torch, Theano, Pylearn2, Keras, Lasagne, Caffe, Chainerなどを考えています.

参考文献:

Sessionで挙がった特に見るべき動画:


ツイートまとめ (Togetter)

「第49回 データマイニング+WEB @東京( #TokyoWebmining 49th ) ー機械学習 方法論 祭りー」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:


■講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

Wiki


振返り:

振返りホワイトボード(Keep/Try/Talk候補):

f:id:hamadakoichi:20151024192736j:image

■過去開催内容:

2015-08-01

[][] 第48回 データマイニング+WEB @東京( #TokyoWebmining 48th ) ーAWS上での分析基盤アーキテクチャ最前線 祭りーを開催しました  第48回 データマイニング+WEB @東京( #TokyoWebmining 48th ) ーAWS上での分析基盤アーキテクチャ最前線 祭りーを開催しましたを含むブックマーク  第48回 データマイニング+WEB @東京( #TokyoWebmining 48th ) ーAWS上での分析基盤アーキテクチャ最前線 祭りーを開催しましたのブックマークコメント

2015/08/01 "第48回 データマイニング+WEB @東京( #TokyoWebmining 48th ) ーAWS上での分析基盤アーキテクチャ最前線 祭りー" を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20150801133516j:image

参加者Twitter List : tokyowebmining-48

参加者セキココ:第48回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@

O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1.「AWSでのビッグデータ分析」(講師: @ )(発表:40分+議論:30分)

AWSでは現在40を超えるサービスが提供され日々更新されていますが、その中からビッグデータ分析に関連するサービスを一挙にご紹介します。合わせて、可能な限り事例やデモを交えながら実践的な内容もお届けします。

参考文献:

2.「1000人規模で使う分析基盤構築 - Redshiftを活用したEUC - 」 (講師: @ )(発表:30分+議論:35分)

1000 人規模の会社におけるRedshiftを中心とした基幹データの活用事例についてお話します。ETL、データ運用、Redshiftのパフォーマンス測定 結果や利用Tips、運用ロールなど、全社でどのようにデータ活用を実施しているかに興味ある方には面白い内容かもしれません。

参考文献:

3.「SmartNews の Webmining を支えるプラットフォーム」 (講師: @ )(発表:30分+議論:35分)

数百万のユーザーが毎日使ってくれている SmartNews。その裏側では、機械学習やインテリジェンジェントなデータ処理、別の言葉で言うと、WebMining が動いています。さらに、その裏側では、その WebMinging を支えるプラットフォームが動いています。そのプラットフォームも、AWS や Spark を使いこなしながら日々進化しています。そんなプラットフォームを中心に、WebMining 自身の話も交えながら、紹介します。

参考文献:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード(Keep/Try/Talk候補):

f:id:hamadakoichi:20150801193801j:image

■懇親会LT:

クラウド温泉への誘い「クラウド温泉5.0@小樽MLスペシャル」(@)


ツイートまとめ (Togetter)

「第48回 データマイニング+WEB @東京( #TokyoWebmining 48th ) ーAWS上での分析基盤アーキテクチャ最前線 祭りー」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:


■講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

Wiki

■過去開催内容:

2015-06-27

[][] 第47回 データマイニング+WEB @東京( #TokyoWebmining 47th ) ー潜在モデリング 実活用 祭りーを開催しました  第47回 データマイニング+WEB @東京( #TokyoWebmining 47th ) ー潜在モデリング 実活用 祭りーを開催しましたを含むブックマーク  第47回 データマイニング+WEB @東京( #TokyoWebmining 47th ) ー潜在モデリング 実活用 祭りーを開催しましたのブックマークコメント

2015/06/27 "第47回 データマイニング+WEB @東京( #TokyoWebmining 47th ) ー潜在モデリング 実活用 祭りー" を開催しました。

会場提供し運営を手伝って下さった SmartNews のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20150627140038j:image

参加者Twitter List : tokyowebmining-47

参加者セキココ:第47回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@

O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1.「分析のビジネス展開を考える―状態空間モデルを例に」(講師: @ ) (発表:30分+議論:40分)

本発表では状態空間モデルを例に、数理分析をビジネスに展開する際、モデルの仮定や前提条件などに留意する重要性を考えます。

ビジネスの問題を適切な数理モデルに翻訳すれば、その豊富な成果が解決策を与えることも多々あります。例えば状態空間モデルは、当初の状態制御への適用から、最近では広告の効果測定への適用例も見られます。これは、モデルに現場の知恵が導入しやすく、結果も分かりやすいためかと考えます。

ただし、モデルには仮定や前提条件なりがあります。それらを無視した適用は、大きな被害に繋がりかねません。今回は状態空間モデルで、それらに留意した分析設定、顧客からそれらの範囲外を求められた際の対応を考えます。

参考文献:


2.「トピックモデリングによる評判分析」 (講師: @ )(発表:25分+議論:35分)

製品やサービスにおいてお客様の声を把握・分析し、改善に繋げることは重要です。このような営みにおいて、評判分析はお客様の声のデータから対象が好評か不評かという情報を自動的に抽出/決定できる有用な技術です。

評判分析においては様々なアプローチが存在しますが、本発表では2014年初頭までに提案されてきたトピックモデリングについてご紹介します。

トピックモデリングによる評判分析に注目した理由として、

  1. 潜在構造のモデリングによって観測データが内包するドメイン依存などの問題に対処できる可能性がある
  2. テキストと同時に観測されるサイドインフォメーション(ratingや商品分類タグなど)を統合的なモデリングによって有効活用できる可能性がある
  3. 評判の生成過程をトピックモデルのような階層ベイズ的確率モデルでモデル化することにより、複雑かつ定性的可視化が比較的容易にできる

といった事柄があげられると考えています。

本発表は学術的な側面が強いですが、今回の発表を通じて実応用に対するギャップなども考えていけたらよいなと思います。


3.「SNPのオープンデータを覗き見る」 (講師: @ )(発表:20分+議論:30分)

最近話題となっている遺伝子解析サービスについてさまざまな議論がされていますが、現在では一部の日本人について研究レベルで遺伝子解析の結果がオープンデータとして公開されているものもあります。

それらのデータから分かることと、分からないこととを見ながら臨床で行われている遺伝子解析の紹介もできればと思います。

参考文献:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード(Keep/Try/Talk候補):

f:id:hamadakoichi:20150627213129j:image


■懇親会LT:

Hadoop Ops & Fabric (@)

アイドル現場とデール・カーネギーの密接な関係 (@)


ツイートまとめ (Togetter)

「第47回 データマイニング+WEB @東京( #TokyoWebmining 47th ) ー潜在モデリング 実活用 祭りー」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:


■講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

Wiki

■過去開催内容:

2015-05-30

[][] 第46回 データマイニング+WEB @東京( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りーを開催しました  第46回 データマイニング+WEB @東京( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りーを開催しましたを含むブックマーク  第46回 データマイニング+WEB @東京( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りーを開催しましたのブックマークコメント

2015/05/30 "第46回 データマイニング+WEB @東京 ( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りー" を開催しました。

会場提供し運営を手伝って下さった SmartNews のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20150530134840j:image

参加者Twitter List : tokyowebmining-46

参加者セキココ:第46回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@

O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

※内容は上記ホワイトボード写真参照


1.「トピックモデルことはじめ」(講師: @ ) (発表:45分+議論:50分)

トピックモデルについて、ユニグラムモデル・混合ユニグラムモデルを通じて必要となる知識をまとめ、拡張に関しても説明します(主に参考書籍(1)をベースに)。また、可能であれば適用事例についても、ご紹介させていただきます。

参考文献:

[書籍]

[文献]

[サイト]


2. 「傾向スコアを使ったキャンペーン効果検証」 (講師: @ )(発表:20分+議論:25分)

オンラインの世界では最早標準的になった様に見えるA/Bテスト(無作為化試験)ですが、オンラインの世界ではコストやポリシー的な理由で実施でき無い場合が多くあります。今回は、傾向スコアと言う値を用い、擬似的にA/Bテストをしたかの様な結果を求める方法をご紹介します。

参考文献:



3. 「"移動"にまつわるBIG DATAの応用事例と解析手法 ~ Bayesian Modeling を添えて ~」 (講師: @ )(発表:30分+議論:35分)

本発表では位置情報を活用したサービス事例及び解析手法について取り上げます。内容としては、私自身が学生時に研究で扱っていた"Probe-Car data"(車両の軌跡のデータ) の活用及び研究事例や、タクシー配車サービスである"Uber"で用いられているデータ活用事例に触れていきます。具体的に"Uber"では、配車時におけるユーザーの位置やその他の特徴量を用いて、ユーザーの目的地を予測し、配車の最適化を図っています。そこで用いられている"Bayesian Modeling"は、"Data Science"界隈でも非常に重要な手法の一つです。本発表においては、それら手法の基礎的な事項を踏まえながら、共に学習していきたいと思います。

参考文献:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:@ (30分)

「振返り・アクション決定」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード

f:id:hamadakoichi:20150530213856j:image


ツイートまとめ (Togetter)

「第46回 データマイニング+WEB @東京 ( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りー」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:


■講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

Wiki

■過去開催内容: