2010 | 02 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 03 | 04 | 05 |
2012-01-31
■バッギング、ランダムフォレスト、ブースティング
今回は集団学習(アンサンブル学習)で良く出てくる、バッギング、ランダムフォレスト、ブースティングについてメモしておきます。参考にしている教科書はこちらです。貼りつけている数式もこの教科書から抜粋しています。
- 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman
- 出版社/メーカー: Springer-Verlag
- 発売日: 2009/03
- メディア: ハードカバー
- クリック: 56回
- この商品を含むブログ (13件) を見る
どの手法も、「弱い学習器」をたくさん集めて良い予測値を得ることを目指しています。弱学習器を集めているせいか、予測精度は高いのに過適合しにくいのが特徴です。教科書の事例では学習データでどんどん学習させても、テストデータに対して予測エラーが全然上がらない(つまり過学習していない)。
1. バッギング(Bagging)
データをブートストラップサンプリングし、予測器f(x)を作る。それをB回繰り返し、それぞれの予測器の平均値を予測値とする。
特に、f(x)が決定木(decision tree)の場合をバッギング木(bagged tree)という。
2. ランダムフォレスト(Random Forest)
バッギング木と似たアルゴリズムだが、説明変数もランダムにm個選択するところが大きく異なる。バッギングと同じように、データは毎回ブートストラップサンプリングする(P588)。
3. ブースティング(Boosting)
アルゴリズムGの予測値を実測値に近づけるように、予測値の加重和パラメータω、アルゴリズムの加重和パラメータαを計算する。最終的にM個作ったアルゴリズムをαで加重和したものを予測値とする(下記の結果変数は[-1, 1]なのでsignを予測値としている)。
パラメータの計算方法で最も有名な方法が、アダブーストM1(Ada Boost.M1)である(P339)。また、アルゴリズムGの損失関数の微分(勾配)を利用して、パラメータ更新を素早く行うことのできる手法が、勾配ブースティングモデル(Gradient Boosting Model, GBM)である(P361)。
- 298 http://search.yahoo.co.jp/search?p=感度+特異度&search.x=1&fr=top_ga1_sa&tid=top_ga1_sa&ei=UTF-8&aq=0&oq=感度+
- 262 http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CDAQFjAA&url=http://d.hatena.ne.jp/isseing333/20110304/1299214642&ei=6fgsT_bHBuHSmAXs18HMDw&usg=AFQjCNGPJ7Y64N1EuATc3rtxC5UGCpqe9Q&sig2=-C8ty8iYSFesjXSPpYgeNQ
- 255 http://www.google.co.jp/url?sa=t&rct=j&q=データマイニング&source=web&cd=11&ved=0CL0BEBYwCg&url=http://d.hatena.ne.jp/isseing333/20111123/1322053940&ei=45QfT6yCGdDimAXfv_3CDw&usg=AFQjCNE2e
- 246 http://www.hatena.ne.jp/
- 231 http://www.google.co.jp/url?sa=t&rct=j&q=感度 特異度&source=web&cd=1&sqi=2&ved=0CDEQFjAA&url=http://d.hatena.ne.jp/isseing333/20100719/1279522535&ei=NRooT9uRO-Lt0gH1lPHdAg&usg=AFQjCNHH8FSBAaNZU7fkUGJxUIU9SA
- 184 http://www.google.co.jp/url?sa=t&rct=j&q=感度 統計&source=web&cd=2&ved=0CDMQFjAB&url=http://d.hatena.ne.jp/isseing333/20100719/1279522535&ei=vTspT8SfIMPHmQXftoGtAw&usg=AFQjCNHH8FSBAaNZU7fkUGJxUIU9SAVMxA&sig2
- 178 http://b.hatena.ne.jp/hotentry/knowledge
- 178 http://www.google.co.jp/url?sa=t&rct=j&q=感度+特異度&source=web&cd=1&ved=0CDMQFjAA&url=http://d.hatena.ne.jp/isseing333/20100719/1279522535&ei=6FIoT8OQDKjbmAWHs_HbAw&usg=AFQjCNHH8FSBAaNZU7fkUGJxUIU9SAVMxA&sig
- 149 http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=1&ved=0CCQQFjAA&url=http://d.hatena.ne.jp/isseing333/20100924/1285316652&ei=bpQrT4HLH-TGmQX00rjiDw&usg=AFQjCNGzFiQLwsxtL_BzTmqUUMJCdKtpzQ&sig2=9yJfDVhO_3wFB--Kp8ykrw
- 139 http://www.google.co.jp/url?sa=t&rct=j&q=陽性的中率 ppv&source=web&cd=1&ved=0CCgQFjAA&url=http://d.hatena.ne.jp/isseing333/20100719/1279522535&ei=acEoT5iyEo-ZiQf7iNTvBA&usg=AFQjCNHH8FSBAaNZU7fkUGJxUIU





