天気予報、株価予測、ガン患者の生存率、競馬など賭け事、洪水の管理、保険の料金など世の中では確率のことばで語られるものは多い。量子力学などは確率計算そのものだし、最近流行りの大規模言語モデルは確率モデルだ。
情報社会は「予測マシン」で動いているなんてトロント大学のAI研究所の権威が主張していたけど、いかに人びとがふるまうかを確率的に推測するのは先端ITビジネスのコアテクノロジーなんだろう。
そういえば、情報通信の理論と実装には確率論が不可欠だったかな。通信バスの誤り検出とかシャノン情報量なんかを念頭に置いての部外者的臆断であります。
ハッキングの「偶然を飼いならす」のが現代文明の重要な存立基盤になっている。
それほど重要なポジションに「確率論」が置かれている。
ここで、殊更に「確率ってなんだろう」と問う意味はあるのだろうか?
自分はあると思いたい。
「あなたの10年後の生存確率はXX%です」なんて、言われたときのバックグランドは何なのだろう。それは事実に基づく確率算出なんだろうか?
「事実」というと社会&医療統計が絡まってくる。そのバックグランドは何らかのの集合を選んでくるはずだ。例えば、「40代の独身男性で透析を受けている日本人」のような参照されるべき集合に対する観察データがある。その人たちの10年後生存率が「数値」としてあるから語れるのだ。
「それはそれでいいではないか? 何も情報がないより余程いい」
そういう人は多いし、そこで判断中止もありうる。
でも、変な感じが残る人が「確率の哲学」に突き進んでいくようだ。
独身男性とか、40代とか、日本人とか曖昧な概念に疑問を抱くのもある。独身とは既婚歴の有無は関係ないのか、男性もLGBTの性向と無関係といえるかどうか、年齢は詐称などされていましか、日本人とは出生地なのか血統なのか国籍なのか。遺伝子で日本人と判定するのか? パリ駐在員の子どもでフランス生まれみたいなケースはどうなのか。そんなものはレアな特性ばかりだから無視しようという立場は現実的ではない。ロングテールは無視できないのだ。
「40代の独身男性で透析を受けている日本人」は確率の対象である集合に値しないように思える。
唯名論は自然科学と親和性が高いと感じる。野球ボールは自然界に存在しない。それは特定の社会で名付けた工業生産物を「野球ボール」と呼びましょうという規約なのだ。
仮に日本の野球ボールと大リーグの野球ボールとは規格や規約としよう、それらを確率計算の対象にしていいかどうかは自然に決まるわけではない。
単なるお約束のカテゴリーなのだ。数学的な集合とは違うのでないだろうか?
同様に「日本人」も規約に従う命名でしかない。それを確率計算に使うというのは、厳密さとは程遠いものであろう。
もう一つ、「自分」というのは虫山蝶太郎という個人なら、その一回限りの存在について確率を語るのも違和感がある。大量生産されたサイコロとわけが違う(管理された国民という観点もある。それは量産された均一で信頼性のある人間だという解釈もあるけれどね)
天気予報も明日の関東地方の天気の確率って、どういう意味なのか?
観測史上では20XX年MM月NN日は一回しかない、その一回限りの確率を語るのは、見たこともないサイコロ(インチキのサイコロかもしれない)をふる確率と似ているのでないか。
これに類することは山ほどある。史上初の原子力推進の宇宙船が発進する。では、事故に関する損害保険はどう見積もればいい、とか。
不沈船とされたタイタニック号の損害保険はどう見積もられたのだろう。
曖昧な類似事象を寄せ集めることで「擬似観測データ」を突き合わせるのかもしれない。
背景となる母集団は限りなく曖昧であることが多い。また、レアな事象や再現不可能な事象の確率はどうしたものかという困難がある。
疑問の所在は明らかになっただろうか。
確率の哲学はそうした疑問に応えるべく、研究されている。残念ながら、哲学にありがちだが、満足な答えは得られてはいない。ですけれども、「確率」なるものが一筋縄ではいかぬ複雑なものであることを示している。
数学的な確率の定義はあいまいさはない。それを現実世界に持ち込むとそれは人間の主観と概念の曖昧さと観測の限界とで途端に破綻する(言い過ぎか)