Hatena::ブログ(Diary)

hiroyukikojimaの日記

2008-07-24 統計学の面白さはどこにあるか

 先日、とあるパーティで、統計学者の松原望先生と会った。

 松原望先生は、早期からベイズ統計学の重要性を世にアピールしてきた先駆者である。ぼくは、経済学部大学院在学時に、選択科目ではあったが、松原望先生の「ベイズ統計学」という講義を受け、そこでベイズ理論の指南をしていただいた。ぼくは『確率的発想法』NHKブックスや『使える!確率的思考』ちくま新書の中で、ベイズ理論を紹介していて、それが多くの読者にウケて、この二冊はセールス的にも良い実績を出しているのだけど、正直言ってここに書いてあることの多くは、松原望先生の講義の受け売りである。そういう意味では、下品ないいかたになるが、大学院の数ある講義の中で最も「金に換えることのできた」講義が先生の講義だった、ということになる。

 そのときは、放送大学の教材であった統計的決定』という本を教科書に使った。これがめちゃくちゃいい本で、今でもベイズ統計学に関しては、これを越える本を知らない。とか、いいつつ、アマゾンを見てみたら、

入門ベイズ統計―意思決定の理論と発展

入門ベイズ統計―意思決定の理論と発展

という本がつい最近出版されていることを今知った。これはチェックしなきゃな。もしも、『統計的決定』をリライトしたものなら、名著である可能性が高い。

 ぼくは、大学院入学時にベイズ統計に興味があったわけではなかった。ひょんな偶然から松原望先生の講義に出席することとなった。というのも、院に、ちょうどぼくが中学生のときに塾で教えた子がいっしょに進学することになっていて、偶然出くわした。久しぶりの再会だった。そこでその子が、「小島先生はどういうことを研究したいのですか」と問うので、「ケインズ的な論理的な意思決定をきちんと数理化してみたい」というようなことを口からでまかせに答えたら、その子は、「ベイズ確率みたいなものですか?」といったのだ。そこでぼくは、「ベイズ確率」ということばが気になりだした。そうして、シラバスを読んでみると、これみよがしに松原望先生の同名の講義があるではないか。それでぼくは飛びついた、という次第なのである。

 将来というのは、ほんとにわからないもので、現在のぼくは、サベージ流の意思決定理論の流れの中で研究をしている。サベージというのは、ベイズ理論の復権を達成した偉大な統計学者である。流れ流れてぼくは、ベイズの世界にどっぷりと漬かることとなってしまったのだ。これは松原望先生の講義に出た日から始まったことだといえる。

 松原先生には、パーティの席で、拙著『完全独習統計学入門』ダイヤモンド社について、過分なお褒めのことばをいただいた。

完全独習 統計学入門

完全独習 統計学入門

パーティにおける麗句だと割り引くべきだが、それでも師匠のことばは嬉しいものだった。この本は、刊行されてまだ2年たっていないが、とても良いセールスを記録しており、アマゾンで「統計学」で検索をかけるとときどき1位になっていることがあるほどである。早晩、ぼくの書いたすべての本の中で、最も部数の多い本となるだろう。

 この本は、ぼくにとって、意義深い本である。なぜなら、ぼくと統計学の関係が凝縮された本だからだ。この本のあとがきに書いたことだけど、ここでも(宣伝の意味も込めて)繰り返しておこうと思う。

 ぼくは、経済学部大学院を受験する、と決めたとき、過去問を入手して、戦略を練った。そして、専門の経済学の問題には歯が立たない可能性が高いので、むしろ統計学の問題を選択したほうがまだマシだろう、と踏んだ。それから、生まれて初めて統計学の勉強を(俄仕込みで) 開始したのだ。

実はぼくは、数学科時代、全く確率統計には関心を持たなかった。数学というものは、純粋に超越的な形而上学であるべきで、生臭い現実と関わりを持つ確率や統計数学ではない、そう感じていたからだ。

そんなぼくが、統計学の勉強を始めたら、とにかくつっかえるつっかえる。頭の中は疑問符でいっぱいになった。何冊の本を読んでも、ぼくの疑問はスッキリ解決されることはなかった。もちろん、計算の仕方はすぐに覚えることができたが、「何か変だ。どこかごまかされている」そんな感触をぬぐい去ることはできなかった。それで大学院入学後は、統計学の講義を極力履修した。松原先生のベイズ統計ばかりでなく、普通のフィッシャー・ネイマン流の統計学もきちんと勉強した。それで、ぼくの疑問のありかはハッキリした。つまり、

 統計学の理論には、ある種の確信犯的な飛躍があるのだ。

もっというなら、統計学というのは、数学とは全く異なる学問である。数学は完全無欠な「演繹的推論」であるが、統計学には一部に「帰納的」な考えが混入しているのだ。それが、数学にどっぷり漬かってきたぼくには、「論理飛躍」に見えていた部分だったのだ。「演繹的推論」というのは、「人間はすべて死ぬ。だから私も死ぬ」という風に「全体から部分へ」という推論の形式である。したがって、決して間違うことはない。それに対して、「帰納的推論」というのは、「今までみたカラスはみな黒い。だからすべてのカラスは黒いに違いない」という風に、「部分から全体へ」という推論である。これは全くの「飛躍」である。ここに数学とは違う論理が混入しているのだ。だから、統計学を学ぶときは、このような「帰納的推論=飛躍」がどこでどういう風になされるかを捉えなければならない。このような「帰納的推論=飛躍」は、言ってみるなら、一種の「思想」なのだ。つまり、

 統計学とは、思想的な部分を持っている。

ということなのである。このことをやっと大学院で悟ったぼくは、むしろ統計学ががぜん面白くなった。いったん思想だと把握してしまえば、あとはその思想の切れ味を評価すればいいだけである。「完全な思想」などこの世の中にはない。「完全な思想」とはいってみるなら、「何も語っていないジェネラル・ナンセンス」と一緒だからだ。思想にとって重要なのは、完全性や汎用性ではなく、「切れ味の深さ」である。

 そんな風に悟ったぼくは、大学で統計学の講義を受け持つようになってから、ぼく流に統計学の思想的部分を解釈し再構築しよう、と試行錯誤を繰り返した。そして、長年かかってたどりついた結論が、さきほどの『完全独習 統計学入門』ダイヤモンド社なのである。この本の特徴は、とにかく、統計学なのに確率を使わない」、ということである。そんなこと可能なのか、と思うかたは是非読んでみて欲しい。(ふっふっふ。これが罠なのさ。笑い)。ぼくが、統計学を勉強してきて最も気になったのは、「時制」のことである。観測されたデータは、「過去」のものである。対して、確率というのは「未来」に関するものである。けれどもここに不可思議な混乱が潜んでいる。過去のデータも、それが生起する前にさかのぼれば、それは「未来」のものとなる。逆に確率的事象もそれが生起したあとの時間から見れば、「過去」のことである。いったい、「データ」と「確率」という形で、「過去」と「未来」を区別することに何の意味があるのだろう。にもかかわらず、統計学では、「平均値」と「期待値」、「データの標準偏差」と「確率変数標準偏差」等々という形で、同じ計算を二度ずつ定義する。これは謎そのものではないだろうか。そこでぼくは、大胆にも、「確率」という概念を精密に定義することを捨て去って、すべてをデータの中で論じることにしたのである。(これ以上は読んでのお楽しみ)。こんなことをした結果、この本では、「時制の問題」が浮き彫りにされることになった。そういう意味では、挑発的な書き方をしている、といってもいいのだ。この本ほど、統計学の「論理飛躍」を正面きって書いたものは他にないのではないか、と自負している。ちなみに、「確率を全く使わない」戦略のおかげで、使うのは中学数学だけで済む、という御利益ができた。微積もコンビネーションもいらない。ルートと1次不等式だけでオッケーだ。これは、説明をごまかした、ということではなく、統計学の思想的な部分を煎じ詰めたらいらなくなってしまった、にすぎない。(ちょっと嘘があるかな)。

 そういう思想的な観点からいうなら、ベイズ統計学はもっと思想的である。幻想的である、といっていいぐらいである。それがベイズ理論の尽きせぬ魅力なのである。ベイズの解説は、またの機会にまわすので、そのときを乞うご期待。

 松原望先生には、「同じ流儀でファイナンスの本を」という激励をいただいた。ファイナンス理論というのも、ぼくにとって、尽きせぬ謎ととんでもない論理飛躍に富んだ分野なので、いずれ本腰を入れて取り組みたいと思っている。現在、大学院金融工学の講義を隔年で持っているので、いずれそれをベースに本が書けたらな、と思う次第だ。