Hatena::ブログ(Diary)

知行合一日記

2012-05-25 データ解析のための統計モデリング入門

秀逸だと思う。

買った、買ってしまった…。というのが正直なところ。
現在は統計モデリングを行うような環境にはいないし、これを読んでいる場合でもないことは重々承知している。でも、ジュンク堂書店で見てしまったとき、買わずにはいられなかった。


学生時代に、著者のwebページで、統計解析の講義文書を読まなければ、自分は統計解析やRにここまで関心は持たなかっただろう。また、おそらく生態学に関わる人以外でも、多くの方が著者のwebページにはお世話になっているだろう(だって、google検索ですぐ引っかかるんですもの)。そんな日本における、統計モデリングの普及に大きく貢献している著者。


そんな著者の解説は非常に簡単で読みやすく、また解説も的確で、本当に素晴らしい。これからデータ解析を始めるにあたり、ぜひ頭の片隅に入れておいてほしいことばかりでした。


特に、個人的に「はっ」とさせられたのが、AICは「よりよい予測のための指標」という点、そして、平均対数尤度とバイアス補正に関する説明。非常にわかりやすく、そして的確な書き方でした。


特に前者に関しては、盲目的にAICが最小を選べというわけではなく、AICが意味するところをしっかり抑えて、モデル選択をすべき、もしくは物事をデータから捉える必要があるんだなと改めて思いました。
本書冒頭にある赤池氏の文章を、しっかり念頭に置いてデータ解析をやっていくべきでしょう。


…ただ、p値そして有意差なる考え方、手法はこれからも主流であり続けるとは思います。論文を投稿するに当たり、p値を示せ、と言われたときは、やっぱりねと思いました。多くの論文投稿規程に「統計手法」や「p値」を示せと書かれており、また複雑な統計解析をした場合をしっかりそれを説明しろとも書かれています。分野によるのでしょうが、著者のいうブラックボックス統計学はなかなか終焉を向かえるのは難しいのではないかと思います。お手軽だし、パッと見で分かってしまうからです。複雑なモデリングをレフェリーに説明するには、やはり統計モデリングに強い人と協力しないとかなり難しいのではないかと、個人的には、思います。


さて、後半はベイズの話が中心になり、より複雑な、というより現実のデータ解析に即した解説になっていきます。

ベイズ統計を駆使した統計解析なんて、なかなか「実験室」データでは使わないかもしれませんが、説明も丁寧でMCMC法からかなり分かりやすく書かれています。ベイズ手法への導入書、入門書としてもかなり良書だと思いました。またその手法の弱点や不明点についてもしっかり言及してくれている点がいいなと感じました。

投稿したコメントは管理者が承認するまで公開されません。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト

コメントを書くには、なぞなぞ認証に回答する必要があります。

トラックバック - http://d.hatena.ne.jp/mahha1024/20120525/p1
リンク元