LibrePDMの日記 このページをアンテナに追加 RSSフィード

2011年05月10日 地震の発生確率について このエントリーを含むブックマーク

竹中平蔵さんのtweetが大分叩かれているようです。

http://togetter.com/li/133823


この87%という確率はBPT分布に従って算出されています。*1

http://www.asahi.com/national/update/0507/TKY201105060460.html によると、直近の東海地震は1854年の安政東海地震で、さらに周期は100-150年と考えられているとのことです。

つまり、下記の図(正確ではありません。ラフなものです)の、 (青色部分の面積)÷((青色部分の面積)+(黄色部分の面積))が 0.87 であるということです。

f:id:LibrePDM:20110510175314p:image

このように、一様な分布ではないため、たとえば直近の1年間に東海地震が起きる確率は、(87% ÷ 30) よりも大きいものになります。

逆に、今から29年後から30年後までの1年間に東海地震が起きる確率は、(87% ÷ 30) よりも小さいものになります。

よって、竹中さんのtweetの計算方法は、リスクを過少に見積もっていると言えると思います。*2


こういう見方で論じている tweet はあまりないような気がしたので書いてみました。私も経済学研究科在学の大学院生なので数学地震専門家ではありません。ご批判・コメント等ありましたらお気軽に。


【追記】

id:fuka_fuka さんのブックマークコメントより

周期のピークを過ぎると「もう起こらないだろう」とみなされているとは知らなんだ。

それは少し違います。「条件付き確率」という考え方なのですが、「今から1年間地震が起こらなかった条件下で、今から1年後から2年後までの1年間に東海地震が起きる確率」>「直近の1年間に東海地震が起きる確率」> 「今から1年後から2年後までの1年間に東海地震が起きる確率」となるのです。

よって、上で紹介した朝日新聞の記事で、『地震調査委は04年、30年以内の発生確率を「84%」と公表。その後の時間経過から今年1月現在で「87%」と計算した。』と書かれているように、地震が起こらなかった条件下では、徐々に一定期間内の発生確率は上がっていくことになります。これは、直感的な感覚*3とも合致しているのではないかと思います。


*1http://www.jishin.go.jp/main/chousa/10_yosokuchizu/k_keisan.pdf に、「海溝型地震の活動間隔はBPT 分布(Brownian Passage Time 分布)に従うと考えられている」とあり、東海地震は海溝型地震であるため。

*2:あと、そもそも0.2%でさえ決して小さい数値とは思えません。ほぼ3σに相当する値であり、製造業の品質管理などでは許容範囲を超えていると見なされることが多いかと思います。損害額の期待値についての評価はこちらも参考になります。

*3:徐々に危険が迫ってくるようなイメージ

highstreethighstreet 2011/05/11 06:29 idコールされたのでやってきました。

まず、上の図が間違っています。その図は前回の地震直後時点での、次の地震が発生する事前確率です。既に大地震無しに150年が過ぎているのですから、現時点での確率分布は当然その点から始まらなければなりません。当然、分布の形状も全く変わってきます(直近がピークになる)。上の図は、150年以上前の時点での、2011年から30年以内に地震が起こる確率を示しているに過ぎません。

次に、その確率分布の水準から「手前は高い、先は低い」と解釈するのも完全に間違っています。今期に地震が起こらなかった場合に、来期の事後的発生確率は上昇します(上の記事ではその部分だけは正しい)。それを考慮に入れた上で30年で地震が発生する確率が87%なのですから、時間に対して独立な確率過程と比べ、手前の確率が低く始まらなければ釣り合いがとれません。(この説明でぴんと来ないならば、二項分布のツリーでも書いてみると良い)

よって、頂いた「id:highstreet 目先の確率は上がるんだってば・・・」というコメントは間違っています。理論系の方か実証系の方かは存じませんが、事前確率と事後確率を混同するのは猛省を要求される勘違いだと思います。

sonoyamasonoyama 2011/05/11 08:17 たしかに変だと思います。
仮に図の通りだとしても、青の部分の面積が0.87ではないでしょうか?
確率密度関数と累積確率とを混同しておられると見えます。

highstreethighstreet 2011/05/11 08:21 おっと失礼、前半部は上の図の青い部分を発生確率としている、と誤読してのコメントです。その更に右側の面積で割るならば問題ありません。それならば現時点での事後的発生確率を計算するのと同じ結果になるはず。

後ろの2つの段落には変更はありません。

LibrePDMLibrePDM 2011/05/11 08:24 id:highstreet さん。
この図は確かに「前回の地震直後時点での、次の地震が発生する事前確率」ですが、「既に大地震無しに157年が過ぎている」という条件は、分母を157年以降の面積(積分値)に限っていることで考慮できていると思います。
そもそも、これは、政府の地震調査研究推進本部の全国地震動予測地図(http://www.jishin.go.jp/main/chousa/10_yosokuchizu/index.htm)の地震発生確率の計算方法(http://www.jishin.go.jp/main/chousa/10_yosokuchizu/k_keisan.pdf)の考え方そのままです。それが間違っているとは思えませんが・・・

LibrePDMLibrePDM 2011/05/11 09:35 おおっとかぶってしまいました。
sonoyama さんへのお答えにもなっているかと思います。

n-sodan-soda 2011/05/11 10:43 id:highstreet さんの指摘のポイントを理解し損ねていると思います。確率分布の図は、常に最新の状態を反映して再計算しなければいけないんです。プレート型地震発生メカニズムからして、157年前に計算した確率密度グラフのピークを地震発生なしに過ぎた場合、それ以降実際に地震が発生するまでずっと、確率密度を計算し直すたびに「現時点は前回地震発生以降で最高の地震発生確率である」という状態を更新し続けるはずです。上のグラフは157年前に計算した確率分布としては全く正しいし、32年前まではほどほどに使えるものですが、それ以降も157年前と同じ確率分布の計算でよいという仮定は間違ってます。

itaita 2011/05/11 11:16 納得できない人は数値実験をしてみましょう。
BPTを単純化し、ある変数が0からスタートして1ステップで、50%の確率で変化無し、50%の確率で1増加。
何度も試行してこの変数が100を初めて越えたステップ数のヒストグラムを作る。
次に200ステップの時点で100に達しなかった試行に限定してヒストグラムを作る。両者を比べる。

通りすがり通りすがり 2011/05/11 11:17 sonoyama さんの意見は間違ってて、そこはLibrePDM さんが正解です。
id:highstreet n-sodaさんの意見は正解で実際にBPT分布に従う確率密度関数を見てみるといいですよ。

mishomisho 2011/05/11 11:20 BPT分布に基づいて実際の確率を計算してみました。
http://www.bo.ingv.it/~garcia/research/Probabilisticmodels/node7.html
http://www.nilim.go.jp/lab/rdg/division/hazard/shohou16.pdf
国総研の2003年の報告書にある mu=118.8,alpha=0.24 を用いたところ,30年,1年,1ヶ月の発生確率はそれぞれ 0.79, 0.047, 0.0040 でした。
代わりにalpha=0.20を用いたところ,それぞれ 0.88, 0.061, 0.0052 が得られました。

mishomisho 2011/05/11 11:23 ちなみに事前/事後確率の計算手法については LibrePDM さんの記述で正しいと考えます。
n-soda さんの指摘は尤もだと思いますが,そこが正しくないとすると 87% という値もおかしいことになるので,通りすがりさんがほのめかしたように,その機構は BPT 分布のなかに込められている,と信じたいですね。。。。さすがにそこを間違えるような地震学者はダメでしょう。

itaita 2011/05/11 11:52 おそらく事前/事後確率を議論される方の念頭にはモンティ・ホール問題がありますよね。
あの司会者は全てを知っているのでどの扉を開くかは大きな情報であって確率もそれで変わる。
しかし地震の場合はBPTの内部変数であるプレートの状態変数の値は誰も知らず、現在まだ閾値以下であるという情報しかない。
数学的には前の地震の時に次にいつ来るかを神が分布関数にしたがって決めた、としても同じ事。なのでいまある情報としては「その時期が青か黄色の部分にある」しかなくて、これによって確率分布が変化することはない。

LibrePDMLibrePDM 2011/05/11 13:49 id:ita さん
私もそう思います。このケースは http://ja.wikipedia.org/wiki/%E3%83%A2%E3%83%B3%E3%83%86%E3%82%A3%E3%83%BB%E3%83%9B%E3%83%BC%E3%83%AB%E5%95%8F%E9%A1%8C の「変更ルール3」に相当するので、確率分布が変化することはないと思います。

id:misho さん
計算ありがとうございます。確かに「直近の1年間に東海地震が起きる確率は直近の30年間に起こる確率の1/30より大きい」ということですね。

id:n-soda さん
確率分布が変化することはない理由は上で述べたとおりです。
付け加えると、BPTのモデルでも、『157年前に計算した確率密度グラフのピークを地震発生なしに過ぎた場合、それ以降実際に地震が発生するまでずっと、「現時点は前回地震発生以降で最高の地震発生確率である」という状態を更新し続ける』は成立すると思います。

nucnuc 2011/05/11 13:56 要するに、地震学者は地震予知について十分に無能だ、という仮定が受け入れられるかであって、まあ、この場合は受け入れても大きな誤差にはならないのではないでしょうか。

nucnuc 2011/05/11 14:03 これでは文意が分かりませんね。失礼しました、上の無能といっているのは、固有地震であるという以上に予知のために重要な情報を時間経過と共に得ないであろうという仮定のことです。

n-sodan-soda 2011/05/11 14:19 確かに私の書き方は間違ってました。確率と確率密度を混同して書いてますね。
ただ一点納得がいかないのは、元のコメントがどこにあるか発見できてないので誤解している可能性があるんですが「id:highstreet 目先の確率は上がるんだってば・・・」の部分です。id:highstreetさんの『確率分布の水準から「手前は高い、先は低い」と解釈するのも完全に間違っています』というのは正しいはずです。
実際、LibrePDMさんも【『157年前に計算した確率密度グラフのピークを地震発生なしに過ぎた場合、それ以降実際に地震が発生するまでずっと、「現時点は前回地震発生以降で最高の地震発生確率である」という状態を更新し続ける』は成立する】と書かれているということは、この点でそもそも、id:highstreet さんとの意見の相違はなかったと考えてよいのでしょうか?(もしかしてコメントを逆に解釈された?)
ところで、どの方が地震学者なんでしょう^^;(私は素人です)

n-sodan-soda 2011/05/11 14:22 > ところで、どの方が地震学者なんでしょう^^;(私は素人です)

あ、これは id:nuc さんの 14:03 のコメントを読む前に書いてました。
14:03のコメントを読んで自分の誤解に気づきました。
というわけで、上記一行についてはお忘れください。_o_

koalakoala 2011/05/11 15:21 87%という確率は、(白+青)÷(白+青+黄)×100のような気がします。
つまり、今起こる確率も(白)÷(白+青+黄)×100で70%程度はあるというのが
正解だと思います。

highstreethighstreet 2011/05/11 17:10 私の最初のコメントは図の青い部分の面積を確率としている、と誤読してのもので、3番目のコメントで訂正させて頂きました。何人かの方が指摘されているとおり、確率計算はそれで正しいと思います。更新過程の定義そのまんまですもんね。

ただし、私が最初のコメントの第2段落で書いた部分については依然として問題があると思います。今確認したらLibrePDMさんのコメントが消えているので概略を書きますと、

highstreet  分布が時間に対して独立なら竹中教授のやり方で近似可能
andalusia   150年周期なんだから時間に対して独立な訳がない
highstreet  その条件なら目先の発生確率は下がるから問題ない
LibrePDM 目先の確率は上がるんだってば・・・

というコメントを受けてのものでした。地震が発生しない場合の事後的な確率は上昇していき、それでも「30年で87%」なのですから、やはりこのコメントはおかしいように思います。(既に無いコメントを蒸し返すのも何ですが…)

LibrePDMLibrePDM 2011/05/11 17:13 id:nuc さん
それだと聞こえが悪いので「自然は人智を越えて十分に複雑だ」程度にしておきましょうか。:-)

id:n-soda さん
いいえ。大きな意見の相違があります。id:highstreet さんは、
「今期に東海地震が起こらなかった場合に、来期の事後的発生確率は上昇する。」
と書かれています。それ自体は正しいので同意見ですが、BPTで87%を計算するときの前提は「今期に東海地震は起こり得る」です。

koala さん
http://www.jishin.go.jp/main/chousa/10_yosokuchizu/k_keisan.pdf
こちらを読んでください。

LibrePDMLibrePDM 2011/05/11 17:36 11id:highstreet さん
なぜかまた3分差でかぶりましたが(汗)、id:misho さんに計算していただいた結果からも「直近の1年間に東海地震が起きる確率は、直近の30年間に起こる確率の1/30より大きい」は明らかではないかと思いますが・・・
http://www.misho-web.com/diary/201105.html#Diary

itaita 2011/05/11 18:17 定義の混乱があるようですね。
A:今〜1ヶ月後の間に地震が起こる確率
B:今から一年は地震が起こらず、かつ12ヵ月後〜13ヵ月後の間に地震が起こる確率
C:今から一年間地震が起こらなかった場合に、12ヵ月後〜13ヵ月後の間に地震が起こる確率
C>A>B となります。

opechumanopechuman 2011/05/11 21:36 エントリー、コメント含め、非常に興味深く拝見させていただきました。

大体、itaさんの書かれていることで問題解決だと思うのですが
竹中さんの計算は、一様分布を仮定した場合の計算ですらないのに
いかにも一様分布に従った計算であるかのように
書いているのはちょっとまずいのではないでしょうか。
一様分布においても、A>Bですよね。

LibrePDMLibrePDM 2011/05/11 23:16 id:ita さん
それはわかりやすいですね。青色部分の面積はBの積分で、Cの積分ではないですから。
「手前は高い、先は低い」の説明になりますね。

id:opechuman さん
私が「一様な分布ではないため」と書いた時は 157 <= t <= 187 の領域に主にフォーカスしていたため、t < 30 の領域ではBPT分布の場合と同様に0であること(期間中に複数回地震が起きることは想定していないモデル)を暗黙に前提としていました。
全領域が一様分布なら、確かに A>B です。

uncorrelateduncorrelated 2011/05/12 01:16 BPT分布で、確率密度関数のグラフと、過去の東海地震発生年から予測される今後30年間の発生確率を計算してみました。
http://www.anlyznews.com/2011/05/blog-post_11.html
地震調査研究推進本部はサンプルを恣意的に削って、リスクを過大に評価しているかも知れません。
なお竹中氏は、単純計算でも一様分布はなく、指数分布を仮定するべきだと批判を受けているように思えます。

opechumanopechuman 2011/05/12 01:41 なるほど。正確には
「前回の地震が起きてから次の地震が起きるまでの間隔がt年になる確率」
を表す分布がα≦t≦β(α、βはα≦157、β≧187を満たす任意の実数)
において一様ってことですね。
「一様」の直後にある「東海地震が起きる確率」という記述に
意識が引っ張られてしまいました。申し訳ないです。

無理やり揚げ足を取るなら「東海地震が起きる確率」という書き方は
厳密じゃないとは言えるかもしれませんが。
私みたいな読み違いをする人は少数派ですよね、多分。

highstreethighstreet 2011/05/12 08:29 私の書いた「目先の確率は下がる」というのは、andalusiaさんの「時間に対して独立な分布ではなく、周期性のある分布を考えるべき」というコメントに対するものであって、竹中教授の単純な近似値よりも下がる、という意味ではありません。そこで食い違ってたんですね。
BPT分布では更新過程は右上がりになりますから(C>A)、更新過程がフラットのポワソン分布よりも低い確率から始まらないと、同じ「30年で87%」を達成できません。実際、ポワソン分布では目先1年の発生確率は6.5%前後くらいでmishoさんが計算して下さったBPT分布の数字の方が低くなりますよね。竹中教授は大雑把な近似をしたので、随分低い数字になってますが。
ですから、itaさんが整理して下さったABCは全くその通りだと思いますが(度々の整理ありがとうございます)、BPTでは、やはり時間に独立な分布に比べて手前が低くなる(30年での確率が両者で同じ場合)という結論になるように思います。ただし、それは竹中教授の近似値よりも低くなるという意味ではありません。

LibrePDMLibrePDM 2011/05/12 14:08 id:uncorrelated さん
計算していただいたのはありがたいのですが、サンプルを削った理由は、
http://www.jishin.go.jp/main/chousa/01sep_nankai/nankai.pdf?pages=4
の表1に書いてあるとおり「検討に利用しうる資料が不足し、地震の見落としの可能性が高いと判断」だと思いますよ。
発生間隔は現在に近い方(データの信頼性の高い方)から順に、147年、102年、107年、402年、209年、203年 なので、1498年の明応東海地震以前にはデータの抜けがあると考えるのは極めてまっとうな判断ではないかと思います。
私には、おっしゃるような陰謀論的な考え方は賛成できません。

id:opechuman さん
いえいえ。おっしゃるとおりです。確かにそう読めますね。

id:highstreet さん
なるほど。そういう意味だったんですね。それなら理解できます。
となると、「竹中教授の方法で近似可能」というのがよくわからないのですが・・・オーダーがあっているという程度の意味ということでしょうか?

uncorrelateduncorrelated 2011/05/12 14:38 1497年以前のデータに信頼が無いのは分かります。しかし、1498年-1854年の間だとサンプル数4、観測数3に過ぎないのですが、id:LibrePDMさんは、この87%にどの程度の信頼を置きますか?

私が指摘したかったのはこの点で、87%はサンプル数の不足で、23%はおっしゃるようにサンプルの質で信頼に値しないわけです。その信頼性の低い数字を出しているので、科研費獲得のための陰謀だと揶揄しているわけです。

震度6強の30年間予測が0.0%(福島第一)、0.6%(福島第二)、8.9%(女川)であったので、2011年だけで天文学的なレベルで予測を外しています。1995年阪神・淡路大震災、2004年新潟県中越地震、2005年福岡県西方沖地震、2007年新潟県中越沖地震も予想外でした。

真摯に考えれば「日本全土が地震の危険にさらされており、地震科学では特定地域でのリスクの度合いを測ることはできない」という東京大学のロバート・ゲラー教授(地震学)の主張は説得力を持ちます。

http://jp.reuters.com/article/topNews/idJPJAPAN-20609820110414

こういう状態で、想定される被害や災害対策の不足程度を説明されずに、今後30年間の東海地震発生確率87%と言われても、他の1%の地域より危険だとは思いがたいですよね。

LibrePDMLibrePDM 2011/05/12 14:59 id:uncorrelated さん
もちろん。それほど信頼を置きませんが、だからといって陰謀論に走ったりはしませんよ。
震度6強の30年間予測というと、
http://www.jishin.go.jp/main/chousa/10_yosokuchizu/ka_bunpu.pdf?pages=4 ですね。
地図を見ての通り、日本の国土の大部分は極めて低い数字になっています。
このようなときに、起こった結果から的中度を見るなら、そうような結果になるのは当然のことです。
健康診断の話でよく出てくる、ベイズ推定の偽陽性ですね。

uncorrelateduncorrelated 2011/05/12 16:05 偽陽性の確率も、偽陰性の確率も高くて、全く絞り込めていない状態に思えます。
過去30年間だと、偽陽性が東海地震、偽陽性が1995年阪神・淡路大震災、2004年新潟県中越地震、2005年福岡県西方沖地震、2007年新潟県中越沖地震、2011年東日本大震災ぐらいでしょうか。
なお、震度6強のマップは、4ページではなくて、7ページだと思います。

nucnuc 2011/05/12 21:12 みなさんこんばんは、
ita さん、そして、opechuman さん、おひさしぶりです。

uncorrelated さんの主張は非常によくわかりますが、
少なくとも、こちらのエントリーの趣旨は、
「竹中平蔵さんによるラフな見積の計算方法は妥当なものかそうではないのか」であって、
「来月地震が起きるベイズ確率をできるだけ厳密に見積もるとどのような値が算出できるか」ではないのではないかと思います。

少なくとも、今回の竹中平蔵さんの見積もりの目的は、「拙速でも判断を下すか、熟考の予知があるのかの見積もり」で、ラフな見積をした結果、「熟考したほうがよかったのではないか」という結論です。

それに対して、「竹中平蔵さんは確率をさっぱり分かっていない」という批判が飛んだのですね。

そこで、このエントリーは熟考によるリスクを上から評価しているようです。

もちろん、より厳密な見積もりをすると下がるという話は、別の機会には役に立つでしょうが、
今回の評価の目的からすると、蛇足ではないでしょうか。


ちなみに、地震をやっている人はたいてい理学系の人間なので、ぶっちゃけ、今現在、地震予知が当たるか、そこまで興味がないと思いますよ。

その分野の科学がどの程度信頼できるかも分からずに、政治的に都合がいいというだけの理由で振り回そうとするリテラシーの欠如のほうが問題でしょう。
一般に、自然科学というのは、できるだけ多くの説を出して、それらが切磋琢磨し、淘汰しながら、発展していくものだから、ある程度、未熟な分野ならば探しだせばどんな結論だって見つけ出せるんですよ。

そして、科研費詐欺といっているけれども、もしも、政府に都合がいい説は出さないことにするならば、それこそ知的詐欺。
分からないのは当然だから、知的に誠実でも、未来の科学から見たら間違いかもしれない。それは別にいいのです。
現在の知識でもっともに見える順ではなく、政府に都合がいい説か悪い説かに依存して、研究費が降っていたらそれはまずいでしょうがね。

それでは、今回の政府や竹中さんが諸説ある中で高めと考えられる87%を使って計算したのは妥当か。
となると、迷いがあるのですが、
少なくとも、竹中さんは、上からの評価で十分なので、高めの値を使うのは問題ないでしょう。
しかし、政府は、うーん、リスク評価だから上からでも何とか許せるかなあ、というところでしょうか。

# くだらないツッコミですが、
# 天文学的な数字が小さいです。

LibrePDMLibrePDM 2011/05/13 01:03 id:uncorrelated さん
PDF上は4番目のページなので、私の書いたURLで直接7ページを開きませんか?
地震の予測精度そのものの話は、私にはこれ以上は評価できないので何も言いません。

id:nuc さん
おっしゃるとおり、私のエントリの元々の趣旨では、地震調査研究推進本部の研究そのものは妥当なものと仮定しています。
とはいえ、別ブログに書いてもらったことをわざわざこちらのコメント欄で論じたのも私なので、元々の趣旨から逸脱していてももちろんいいです。

NasatoNasato 2011/05/13 04:30 はじめまして。竹中平蔵氏の計算には同様に疑問を持っているのですが、
その理由として、BPT分布による確率 青/(青+黄) は
徐々に100%に近づいていきますが100%に届くことはないわけですけれど、
竹中氏のモデルは常にその時点から30年評価をして30で割った場合、
大地震のリスクが年3.3%を超えることはないということです。

彼と同じような計算の仕方を用いるなら、今年や今月や今日を
30年の区切りの最終に持ってくれば
毎年、毎日がとんでもなく高い地震の確率となる真逆版です。

私は地震の予測が30年という幅を持たせていることにも意味があると考えていて
過去の7回あったという東海地震の記録の、
それぞれ起こった時点での1年や1月の地震確率は
μやαをどのようにとるかの議論によるでしょうが、
おそらくそんなに高くないと思われます。

ロバート・ゲラー教授が地震の予知は不可能、
鉛筆を曲げていつ折れるかを予測できないと言った意味はそこだと考えます。
時間を横に長くとれば確率は高まりますが、短くとると低くなるのは当然ですし
400年も横軸をとって、常時100%に近いと言っているなら可笑しなことですが
地震学者が30年という時間を確率計算に用いていることには、
人の営みや人生の長さ、対策を講じた場合の費用対効果などについて
いまの予測精度では適当だと考えてのことだと思っています。

highstreethighstreet 2011/05/13 09:03 「竹中教授の方法で近似可能」というのがよくわからない、とのことですので、これ以上のすれ違いを避けるために少し細かく書きます。



一番最初のブックマークhttp://b.hatena.ne.jp/entry/togetter.com/li/133823 でポワソン分布のことを書いたのは、式が簡単でwikipediaでも見れば素人でも容易に再計算可能だからです(1ヶ月の発生リスクはコンマ数%しか変わらないことが容易に確認できる/竹中教授のコメント内容からこれは明らかに許容範囲内)。

BPT分布のほうがより正確なのは明らかですが、あのコメントを書いた時点では87%という数字がBPT分布によるものかどうか判断できなかったことに加えて、

a) BPTは式が複雑すぎる(実際の数字が計算できない/面倒くさい)
b) 自分自身でちゃんと勉強したことが無いのであまり触れたくない
c) 手元に周期に関する資料が無く、探す時間も無い
d) 周期性が不明な場合の地震発生確率にはポワソン分布が用いられる以上、間違いとまではいえない
e) ポワソン分布なら周期性のある分布よりも手前の確率は高く出るので、それでも誤差の範囲内=近似可能であれば、BPT分布に対しても近似可能といえるはず(上で繰り返し書いた話)
f) 周期性のある分布の場合、時間がたつにつれて、地震が1回(以上)発生する確率は、時間に対して独立な分布よりも早く100%に漸近する恐れがある。もし「30年で99%超」という数字が与えられていた場合、その確率はたとえば5年くらいで100%近辺に達してしまっており、その後25年横ばいを続けている可能性がある。この場合、30で割るとひどく過小な数字を得ることになるが、今回は87%なので、この可能性は低い

・・・以上の理由から、ポワソン分布をベンチマークとして近似可能性を判断することに問題は無いと判断したわけです(それでも若干不安があったので「時間に対して独立な場合」と但し書きを入れた)。特にe)の点は、BPT分布から得られる数値を実際に計算できない場合には便利な性質です(その後mishoさんやuncorrelatedさんが計算してくださったので意味がなくなりましたが)。そこで「目先の確率は上がる」とコメントを頂いたので、おいおい、と思ったわけです。まぁ、87%という数字自体が特定の分布を仮定して導かれている以上、それと異なる分布に基づいた数値に問題があるのはもちろん確かです。しかし、実際の数値がポワソンでもBPTでも大差ない点から考えて、竹中教授の数字の誤差は分布の選択ではなく、指数関数を線形近似した事から生じる誤差であったと考えるのが適当なように思います。そして、f)から言っても、コメントの性格から言っても、線形近似は十分許容可能な単純化であると思います。

nucnuc 2011/05/13 10:51 完全に横からですが。


Nasato さん

> 竹中氏のモデルは常にその時点から30年評価をして30で割った場合、
> 大地震のリスクが年3.3%を超えることはないということです。

これは要するに、
「この1ヶ月でダムの水位が10%減って、今30%だから、おそらくもう1ヶ月後には20%になっちゃいそう。だから節水しよう。」
に対して、
「半年後には、-30%入っていることになるからその見積は変だ」といっているのと同じです。
もちろん、乾ききったら話が変わります。
どれくらいの精度でどれくらいの期間について知りたいかによって、どのような計算が許されるかが決まるのです。


highstreet さん

別に、ポワソン分布を使うのはいいんですけれども、
それは、地震が複数回起きうることを仮定しているので、
竹中平蔵さんの計算よりも悪い計算になりそうなのです。

東海地震と呼ばれているのは、「固有地震」です。
The earthquake.
ジ・アースクエイク。約100-150年の周期で発生する地震の次回、
このジ・アースクエイクの起きるタイミングについて議論しているのです。
なので、このジ・アースクエイクがたとえば10年後に起きたら、その次の東海地震はその次の20年間にはまず起きないんですね。
他に、アースクエイクスの起きる可能性は別にあるけれども、それの話はしていないんですね。

つまり、精度として、
BPT分布の精度 > 確率密度が30年間一定分布の精度 > ポワソン分布の精度
(少なくとも、確率密度一定分布の精度 < ポワソン分布の精度 は成立しない)と考えられるので、
竹中平蔵さんの計算が十分に近似として正しい理由の説明としてはおかしいのです。

もちろん、精度が悪いけれども、計算がしやすいという理由で
ポワソン分布を利用して見積もることは問題ありません。

NasatoNasato 2011/05/13 11:44 それに、竹中氏の計算は時間を長くとるほど確率は下がります。
今後50年で東海地震が起きる確率にしたら、
この30年のそれよりもっと確率は上がるのに、
50で割って2%のリスクを超えないので、
やはり私には彼の計算式は納得がいかないです。

ssss 2011/05/13 13:54 > どれくらいの精度でどれくらいの期間について知りたいかによって、どのような計算が許されるかが決まるのです。

> 別に、ポワソン分布を使うのはいいんですけれども、
> それは、地震が複数回起きうることを仮定しているので、
を同時に主張できるのがすごい。ポアソン分布の適用範囲は「次に地震が起きるまで」で(周期性が不明な場合ですから)、その後2回目の地震が起きるかどうかまで単純に拡張して計算したらおかしくなるに決まっていると思いますが。

nucnuc 2011/05/13 17:27 すみません、お邪魔しております。


Nasato さん
たとえば、1000年では100%近いでしょうね、でもそう表現しなかった。あまり意味が無いからです。
こういうときには、30年で87%という数字をわざわざ選んで表現したことから、30年間はそこまで急なアップダウンがない分布なのだろうと推定されます。
たとえば、3年で45%ならば、30年で87%は言わず、3年の方をいうでしょう。

これは単にコミュニケーション上の理由からです。
XX人は80歳まで生きられる人が50%といったら、
だいたい80歳前後で死ぬ人が多いんだろうな、と思いますよね。
ああ、じゃあ、残りである40%は200年生きるんだろうなあ、とは思わない。
そういうことです。
実際、竹中さんの予想通り妥当な予測だったことは上で示されているとおり。

ss さん
おかしくなるかどうかは、欲しい精度次第。

たとえば、ある人の子供の数を概算するのに、二回目以降の結婚によって出来る子供の数の期待値が欲しい精度よりも十分小さいならば、二回以上結婚しないとして、それを無視することはできます。

どう近似するかこそ物理屋の腕。

highstreethighstreet 2011/05/13 17:31 その精度の理解は間違っています。

まず、近似精度は分布の性質(周期性のあるなし)だけで決まるわけではありません。
100%に漸近する関数を線形近似するのですから、それだけでも精度は下がります。
この点による誤差が一番大きい可能性は前回のコメントで指摘したとおりです。

次に、線形の関数が「次第に100%に近づいていく」という周期性を近似するのに
適しているのはおっしゃるとおりですが、そもそもLibrePDMさんが図で書かれているとおり、
周期のピークは既に過ぎており、現時点で見れば「今」発生する確率が一番高い。
この意味で、BPT分布はむしろポワソン分布に近い形になっている(繰り返し書きますが、
これと上の(e)は矛盾しない点に注意して下さい)。

第3に、これが一番大きな問題ですが、周期性があろうが無かろうが、2度目が発生する確率はポワソン分布から得られる確率に影響しません。この手の確率をポワソン分布を使って
出す場合には「T期間に最低1度は事象が起こる」確率を求めるのですから。1度地震が起きた後の事後的発生確率の変化は全く問題になりません。上で繰り返し書いてきたとおり、BPTとポワソンで決定的に異なるのは、期間中1度も地震が発生しなかったときに、事後的発生確率がBPTでは上昇していくという点であって、ポワソンなら大地震が2回以上
起こりうるから精度が低い、という指摘は失当です。

NasatoNasato 2011/05/13 21:50 nucさん、それは順序の問題だと思います。

30年という数字を分割で使うことの妥当性を説明した上での割り算ではなく、
彼は、87%という数字がどう導きだされているのかは知らないと言っているので
単にニュースなどで30年で87%と言っているという言葉を引用したに過ぎません。

では、記者が30年で87%という数字を引用したのはどこかといえば、
地震の学者や文科省など政府関連の資料に30年という
スパンの図が多く用いられているからだと思います。

もし現在、50年で計るのが世間で主流で、
報道がそう報じたならば彼はそのまま50で割ったはずです。
3年で示すのが主流になっていれば彼は3で割ったはずです。
あらゆる確率を線形で計算することに疑問を抱いていないし、
30で割ることが数字として適当な規模だという検証が
彼にあったようには思えません。

全部の事象を線形で判断してみたら、偶然にも誤差が少なかったというのは
計算が妥当だったという検証とは違います。
偶然の一致で良いのならば、現実に今回も
指数関数での単純計算のほうが線形のものよりも分布の式に近い結果となり
単純な割り算は倍近い誤差を生みました。

80歳前後で死ぬ人が多いんだろうな、と思っても
残りである40%は200年生きるんだろうなあ、とは思わない
それと同じで、30年で87%と言われたら、
東海地震はこの30年で来る確率は高いんだろうなと思っても、
今後200年来ないとは誰も思わないですよ。

nucnuc 2011/05/14 22:35 highstreet さん
半順序関係が伝えられる自信がなかったので、
「確率密度が30年間一定分布の精度 > ポワソン分布の精度
(少なくとも、確率密度一定分布の精度 < ポワソン分布の精度 は成立しない)」
と書きましたが、前半部分は撤回させてください。

それでも、やはり
「確率密度一定分布の精度 < ポワソン分布の精度」
を示すのは容易ではないと思います。

第三点については、なんで単純に指数分布と言わないんだ
という疑問があったのですが、
1回目に起きるタイミングだけを問題にしているはずだ、ということはもっともです。
なるほど、私の批判はポイントを外していましたね。指数分布と読み替えましょう。

そもそも、現在の話の内容は、
大きな文脈では「竹中平蔵さんの計算が十分に近似として悪くない理由を説明するのに指数分布を用いてよいか」ですよね。


「30年間確率密度一定の分布の精度 < 指数分布の精度」が成立するという説明をするために、
BPT分布を持ち出しては何もならないわけです。

このたとえが通じるか分かりませんが、これでどうでしょう。

非相対論的にあるラフな計算をしたとしましょう。
それに対して、もっときちんと計算しないといけないはずだ、
というツッコミが入ったら、
二つのことをいう必要があります。
「非相対論的計算は、相対論的量子論で計算した値の十分な近似になっている」
「相対論的量子論のモデルがよいことが、実験的に知られている」

もちろん、
「非相対論的計算は、相対論的に計算した値の十分な近似になっている」
「相対論的モデルがよいことが、実験的に知られている」
の二つ組でもいいんですが、どちらにしても二つ目が必要です。

そして、highstreet さんは二つ目の説明としていろいろあげていらっしゃいますが、
そのうちのいくつかは、
「相対論的計算は、相対論的量子論で計算した値の十分な近似になっている」
「相対論的量子論のモデルがよいことが、実験的に知られている」
に相当するものを持ってきてますよね。

なので、それは問題だと思うのですが、
> 「相対論的モデルがよいことが、実験的に知られている」
に相当するものとして、
> (1ヶ月の発生リスクはコンマ数%しか変わらないことが容易に確認できる/竹中教授のコメント内容からこれは明らかに許容範囲内)
どうやって確認されたかは、分かっておりませんが、
こちらを根拠として使うならば、いいんじゃないでしょうか。


Nasato さん
> 地震の学者や文科省など政府関連の資料に30年という
> スパンの図が多く用いられているからだと思います。

もちろん、このことから

> こういうときには、30年で87%という数字をわざわざ選んで表現したことから、30年間はそこまで急なアップダウンがない分布なのだろうと推定されます。

ということがいえるのです。

「倍の誤差」は、今回の評価の場合、どうでもいいです。
小さい。


この竹中さんのラフな近似について、反対している物理屋は知る限りいませんよ。

NasatoNasato 2011/05/15 00:39 nucさん

すると、nucさんとしては50で割ること3で割ることは適当でなく、
30年での割り算が妥当だと仮定した上で、
今後どれだけ東海地震が起こることなく時が過ぎ、
30年での確率が100%に近づこうとも彼の計算式で
年のリスクの確率は最大で3.3%に収束するように
経営判断するのは正しいとおっしゃいますか。

uncorrelateduncorrelated 2011/05/15 08:08 id:highstreetさん、id:nucさん、id:ssさん
ポアソン過程に従う発生間隔の分布は、ポアソン分布ではなく、指数分布となります。
またBPT分布の一部分を以下のように一様分布を仮定して近似するのが妥当かは、文脈によると思います。竹中氏は具体的なコスト計算はしていないので、具体的な数字は気にしていないようです。
http://www.flickr.com/photos/uncorrelated/5720155318

id:Nasatoさん
横ですが、BPT分布は裾野が平たいので、どんどん一様分布での近似の当てはまりが良くなります。
そして更新過程を適用すると、恐らく西暦2264年ぐらいから、30年発生確率が逆に低下する現象が起きます。
おかしいと思うかも知れませんが、BPT分布も物理モデルから導出された確率過程ではないので、周期性を良く現さない部分もあるようです。

仙谷由人官房副長官が東海地震の想定震源域に建つ浜岡原発を止めることで、原発への不安を和らげたいとの狙いがあったことを認めたので、87%という数字はどうでも良い事は判明しています。
http://mainichi.jp/select/seiji/news/20110514k0000m010111000c.html

NasatoNasato 2011/05/15 09:14 id:uncorrelatedさん

> 更新過程を適用すると、恐らく西暦2264年ぐらいから、
> 30年発生確率が逆に低下する現象が起きます。

貴重な情報をありがとうございます。

私が気になるのは、横ばいになると一様分布の近似に近くなることより、
例えば地震調査委が2004年に30年内に84%だと発表をしたときから考えると
今年は初年目ではなく8年目にあたります。
今年の1月の87%で考えると今年は初年目にあたります。
1996年〜2025年の確率で評価すれば今年は半ばにあたり、
1982年〜2011年の確率で測れば最終年としての評価になります。

毎年その年を最初の年として30年評価して30で割れば
確率は決して100%という数字には届かない以上、
経営上のリスク評価が3.3%/年を超えないし、
ある30年の途中と評価すれば高くなるだろうということです。

NasatoNasato 2011/05/15 09:36 id:uncorrelatedさん

> BPT分布は裾野が平たいので、どんどん一様分布での
> 近似の当てはまりが良くなります。

少し待ってください、青/(青+黄)は上昇を止めるということは
申し訳ないのですが私が肌でわからないので、
実際に何かに演算させて検証をするとして、

やがて一様分布のほうが当てはまりがよくなるというのは
30年で99.9%となる所が仮にあるとして、
単純計算で指数関数で0.01%を30乗根して14.23%/年と出すよりも、
竹中式30年で割って3.33%としたほうが
BPT分布での結果に近づくとは考えにくいのですが。

uncorrelateduncorrelated 2011/05/15 09:55 id:Nasatoさん
確かに確率密度関数f(x)の一階微分f'(x)<0の領域では、一様分布で近似すると1年目は過少評価になりますね。見ての通りですが。
http://www.flickr.com/photos/uncorrelated/5720155318
このブログのエントリーで、id:LibrePDMさんが「リスクを過少に見積もっていると言える」と指摘している通りです。
30年発生確率を87%としたとき、今後1年間の発生確率はBPT分布で約5.8%、指数分布で約6.6%、一様分布で2.9%となるので、地震発生確率を半分に見積もったとはいえます。

しかし、この2倍は大した問題ではありません。竹中氏の主張を整理しましょう。

1.『2年間の原発災害発生確率・原発災害の被害 > 2年間の原発停止のコスト』かについて疑問がある。
2.『2年間の原発停止のコスト > 1ヶ月の原発災害発生確率・原発災害の被害』だとは言える。30年発生確率よりも、1ヶ月発生確率のほうが大幅に低いから
3. 1ヶ月をかけて(1)を検証すべき

実は地震発生確率と原発災害発生確率は異なりますし、原発災害の被害も想定されていないので、実は地震発生確率を何%に想定しても、厳密な話にはならないです。厳密に数字を出すべきところでは無いので、大雑把な数字でいいだろうと言うのが、id:nucさんの指摘だと思います。

なお、仙谷由人官房副長官が東海地震の想定震源域に建つ浜岡原発を止めることで、原発への不安を和らげたいとの狙いがあったことを認めたので、87%という数字はどうでも良い事は判明しています。
http://mainichi.jp/select/seiji/news/20110514k0000m010111000c.html

NasatoNasato 2011/05/15 10:24 id:uncorrelatedさん

一様分布で近似すると1年目は過少評価になりますね。
と仰っているところを見ると、その過大評価は徐々に小さくなり、
その長方形がグラフを上回ったところは
実際よりも大きな評価と仰っているように見えるのですが、

id:itaさんのC>A>Bのように、
起こらなかった場合の次の年のリスクは高まります。
今年が87%の初年目ではなくて、2004年に出した84%の8年目だとしたら
5.8%と2.9%よりも、いっそう過小評価ではありませんか?
そもそもが確率論に意味がないと言うのは、
東海地震自体はこの30年でくるか、来期で来るか、
私らの世代で来るか、曾孫の世代で来るか、
M8.0で来るか、他の震源と連動してM9.0を超えるかなどは
誰にも分からないけれど、いずれ必ず来るが、
その年はいつだと言ったことを議論しているに過ぎないということです。

地震発生確率と原発災害発生確率は異なる。
そのとおりだと思います。M8.4が来ても、
今回のようなまず想定されないM9.0が来ても
過剰に防衛していれば大丈夫です。

菊池洋一氏など元設計者が浜岡を恐れているのは
地震と原発事故との合わせでの心配ですし、
彼らは原発をやめろと言っているよりは、
十分な地震対策をして運行を続けて欲しいと言っているようです。

uncorrelateduncorrelated 2011/05/15 10:42 id:Nasatoさん
> 一様分布で近似すると1年目は過少評価になりますね。
もちろん、更新過程で確率が変化するので、2年目以降は評価しない方が良いでしょうね。分母も変化するからです。

確率的な評価に意味が無いのは、サンプル数が少なすぎるからと言う面もあります。4回の東海地震から、3間隔をサンプルとして使って分布のパラメーターを点推定しているわけですが、以下の程度の情報量しかありません。
http://www.flickr.com/photos/uncorrelated/5715425034
実際の所、1854年の安政東海地震以外は、東海地震であったかも確実ではない状態のようです。BPT分布で87%は尤もらしく聞こえますが、統計学的には信頼性は皆無に近いです。
もちろん、過去にあった規模の地震が、次の瞬間に東海地方を襲っても不思議は無いので地震の備えは重要です。

NasatoNasato 2011/05/15 11:18 id:uncorrelatedさん

本当にサンプルの取り方は様々ですよね。
一部、東海地震であったかどうかも分からないものがある反面、
逆に400年前後空白があるようになっているところも、
東海地震が発生していなかったかどうかが明確ではないようですし、

それに、地震の感覚をこの2000年規模では地球の歴史としては
短期間であると考えてμを評価するのに感覚を均一に回数で割るのか、

それとも大昔の地震よりも、近い時期の周期のほうが
現時点に大きく評価されるように時間も考慮した
複雑な周期の平均を取る式を作成するのかは今回興味を持ちました。

NasatoNasato 2011/05/15 11:21 訂正:感覚→間隔

uncorrelateduncorrelated 2011/05/15 11:24 id:Nasatoさん
> 逆に400年前後空白があるようになっているところも、東海地震が発生していなかったかどうかが明確ではないようですし、

684年、887年、1096年の東海地震は、87%の計算には含まれていません。

NasatoNasato 2011/05/15 11:34 id:uncorrelatedさん

> 684年、887年、1096年の東海地震は、87%の計算には含まれていません。

それは知っています(笑)
途中にある、だから87%はまやかしで、
実際は23%だというエントリーへの反論も兼ねてです。

NasatoNasato 2011/05/15 15:37 参考に朝日が掲載した2004年公表の84%と、
2011年からで87%の数字の出所ですが、
http://www.jishin.go.jp/main/choukihyoka/ichiran_past/ichiran20050112.pdf
http://www.jishin.go.jp/main/choukihyoka/ichiran.pdf
国土交通省 国土技術政策総合研究所ではなく、
文部科学省 地震調査研究推進本部のμ=118.8、α=0.20のようです。

NasatoNasato 2011/05/16 09:15 細かくわかれて申し訳ありません。

それと、東海地震など一部の地域の地震の確率を高く計算して
予算が大きくおりるのは地震学者ではありません。
地震余地は、トータルの地震予測を行っているところなので、
それなら多くの震源の発生率を大きく予測すれば良いのです。

大きな確率予測しているところを外し、
小さな確率予測のところで頻発していれば
むしろ予算は減らされると思うため、
それなりに威信はかかっていると思います。

一部の地域への不安を煽って恩恵に預かるとしたら、
それは地震学者ではなく、官公庁依頼で
対策のための公共事業を請け負う業者ではないでしょうか。

NasatoNasato 2011/05/16 09:18 余地→予知です(汗)