2011-05-01
■[Mahout][Hadoop] Mahout JP を立ち上げました #MahoutJP

Hadoop上で動作する 大規模データマイニング・機械学習ライブラリ Apache Mahout に関し、技術情報まとめ・発信よる活用の裾野を広げることを目的としMahout JPを立ち上げました。
私も含め TokyoWebminingでMahoutに関する各種講師をしていたメンバーや、Tokyo.R、PRML会のメンバー含め、各業界のデータマイニング・機械学習で活動してきたメンバーで集まり、Mahoutに関する情報まとめ・発信をしていきます。
現在、Mahout はドキュメントがまだ整備されていなく、唯一ある書籍 Mahout in Actionでも情報が限られているため、実際に活用しようとするとソースコードから読み込む必要がある状態です。今回、 Mahout JPとして、Mahoutに関わっている各メンバーで集まり、"手法の入門的内容からMahout実行まで"の実際に活用できる情報発信をしていきたいと思います。それにより、大規模データマイニング・機械学習 活用の裾野を広げていきたいと思います。
今回情報発信メンバーの募集に関し、多くの方々から参画の声をもらえ、感謝しています。またさらに、本家 Mahout Wiki 記載されていない各種内容に関しても、日本で先行し情報まとめ・発信ていこうという精力的なメンバー達が集まっており、嬉しく思っています。
これから、Mahout JP をどうぞよろしくお願い致します。
内容構成
現在まずは調査した中で、Mahoutに関し"手法の入門的内容からMahout実行まで"の内容が最も豊富だったTokyoWebminingや、Hadoop Conference Japan 2011での講師内容を中心に、現時点で日本での各情報をまとめてあります。
- Installation : 開発環境の構築法
- members : 情報発信メンバー
Mahout JP 立上げ経緯
関連資料
- Mahout RandomForest Driver 実装法 -大規模分散 機械学習・判別 - - hamadakoichi blog
- Mahout: Canopy and K-means Clustering - hamadakoichi blog
- Mahout: Data Converter for Clustering - hamadakoichi blog
- Mahout Programming : K-Means Clustering - hamadakoichi blog
- Apache Mahout 0.4 - Random Forests - #TokyoWebmining #8 -hamadakoichi slideshare
- Mahout Canopy Clustering - #TokyoWebmining 9
- Introduction to Mahout Clustering - hamadakoichi slideshare
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −2nd Week−方法論・ソーシャル祭り− を開催しました - hamadakoichi blog
- 第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました - hamadakoichi blog
- 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました - hamadakoichi blog
関連サイト
- データマイニング+WEB@東京 (TokyoWebmining) | Google Groups
- データマイニング+WEB勉強会@東京(TokyoWebmining) 開催内容
- Google グループ
推薦文献
- 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman
- 出版社/メーカー: Manning Pubns Co
- 発売日: 2011/10/28
- メディア: ペーパーバック
- 購入: 4人 クリック: 81回
- この商品を含むブログ (9件) を見る
- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 13人 クリック: 295回
- この商品を含むブログ (56件) を見る
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (268件) を見る
- hamadakoichi blog - Mahout JP を立ち上げました #MahoutJP
- hiratake55 の開発メモ - 統計分析環境 R ユーザ向け検索エンジン ...
- hamadakoichi blog - Mahout による大規模分散 機械学習・判別 - R...
- hamadakoichi blog - Perl で MapReduce - Mahout Frequent Patter...
- hamadakoichi blog - 第11回 データマイニング+WEB 勉強会@東京( ...
- hamadakoichi blog - 「Mobageの大規模データマイニング」- #PRMU 2...
- 173 http://twitter.com/
- 44 http://htn.to/g4bTH5
- 36 http://longurl.org
- 25 http://bit.ly/9XD7Cm
- 19 http://www.google.com/url?sa=D&q=http://d.hatena.ne.jp/hamadakoichi/20100822/p1
- 14 http://htn.to/RNj1ag
- 13 http://reader.livedoor.com/reader/
- 13 http://www.google.co.jp/url?sa=t&source=web&cd=1&ved=0CBkQFjAA&url=http://d.hatena.ne.jp/hamadakoichi/20100110/1263127663&rct=j&q=R on eclipse&ei=Zzq-TZecLpD-vQPt2qS1BQ&usg=AFQjCNHBf082PGnAUqtn6y3rFqMm6K0fAg
- 12 http://hootsuite.com/dashboard
- 12 http://htn.to/ko1WTC


