2010-01-05
『良いモデル』の統計学小史:AICからデータ同化まで
上野玄太(統数研)
【文責:林岳彦(シンポ企画者)】
「良いモデルとは何か?」という問いに一つの現実的な解を与えたのが赤池弘次による赤池情報量基準(AIC)である。一般に、パラメータの数を増やすほどモデルのデータへの適合度は上がるが、パラメータの数が多すぎると未来のデータに対する予測能力が落ちる。このとき、AICを指標とすることにより予測能力が最大となる(=AICが最小となる)モデルを最適なモデルとして選ぶことができる。
おそらく多くの生態学者にとってはこの「AIC最小」というのが「良いモデルとは何か」という問に対する答えの一つとして浮かぶのではないかと考えられる。しかしながら、赤池自身はAICの評価について
「パラメータ数の増加に伴って現れる最尤法の弱点を解消するために登場したAICは、分布全体の構造を自由に変えられるベイズモデルの登場により、その役目の大半を終えたかの感がある。(中略)実はAICの歴史的な役割としては、その導入がベイズモデルの実用化に思想的な拠り所を提供したという事実の方が、より重要なものと考えられるのである」
としており、「良いモデル」への探求においてはその後に赤池自身が(また統計学の流れ全体としても)AICからベイズモデルへと主舞台を移したことについて述べている(以下樋口ら2007参照)。
本講演では、生態学者にとっては見えにくいその「AIC以降の統計学の流れ」を統数研の上野玄太氏に解説いただく。さらに、その「良いモデル」を探求する実践における現在の最先端といえる手法である「データ同化」についての解説をいただく。「データ同化」は「モデルのパラメタリゼーション」と「モデルを用いたシミュレーションによる予測」を有機的に繋げる有力な手法であり、生態学/生態リスク学への応用についても、時系列観測データと生態学モデルを繋げたい場合に非常に有効な手法となる可能性が高いと考えられる。
関連図書
- 14 http://hosho.ees.hokudai.ac.jp/~kubo/ce/FaqModelSelection.html
- 7 http://d.hatena.ne.jp/keyword/モンテカルロシミュレーション
- 4 http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&rlz=1T4ADRA_jaJP353JP354&q=ベイズ法 山村
- 3 http://d.hatena.ne.jp/
- 3 http://www.google.co.jp/hws/search?hl=ja&q=「生態リスク」とどう向き合うのか?&client=fenrir&adsafe=off&safe=off&lr=lang_ja
- 3 http://www.google.co.jp/search?hl=ja&lr=&q=AIC+統計&revid=886463323&ei=AnRVS-CUEMuGkAWc8uywCg&sa=X&oi=revisions_inline&resnum=0&ct=top-revision&cd=1&ved=0CAkQ4QIoAA
- 3 http://www.google.co.jp/search?hl=ja&rlz=1C1GGLS_jaJP360JP360&q=林岳彦&start=20&sa=N
- 2 http://k.hatena.ne.jp/keywordblog/最尤推定
- 2 http://search.yahoo.co.jp/search?p=林岳彦&search.x=1&fr=top_ga1_sa&tid=top_ga1_sa&ei=UTF-8&aq=&oq=
- 2 http://www.google.co.jp/search?hl=ja&lr=&rlz=1T4GGIK_jaJP278JP278&q="正規分布" "確率分布" "化学物質"+濃度&start=40&sa=N

