Hatena::ブログ(Diary)

小人さんの妄想 このページをアンテナに追加 RSSフィード Twitter

2010-11-23

小沢検察審議会の平均年齢

検察審議会統計に格好のネタを提供してくれたようです。

すでにあちこちで取り上げられている話題なので今更なのですが、ここでも検証を行ってみました。


* 実態がナゾだらけ「検察審査会」メンバーはホントに存在するのか?

>> http://wpb.shueisha.co.jp/2010/11/01/919/

* 「小沢起訴」審査員平均30.9歳は「100万分の7」の確率

>> http://www.news-postseven.com/archives/20101011_3079.html

小沢一郎民主党元代表に対し、「起訴相当」と議決した検察審査会の審査員は11人いるが、その平均年齢は30.9歳だったとされる。有権者から「くじ」で選ばれることになっているが、有権者の平均年齢は約52歳。この大きな差から、「本当にくじで選ばれているのか」という疑問が湧いている。 (その後、平均年齢には訂正が為されている)


小沢氏を起訴へと追い込んだ東京第5検察審査会について、審査員の平均年齢が不自然に低いのではないかとの疑惑です。

検察審議会の審査員は「各検察審査会管轄地域の衆議院議員選挙権を有する国民の中から、くじで無作為に選ばれた11名で構成される」とのことです。>> Wikipedia:検察審査会

東京審議会であれば、東京都民から無作為に11人を選んだとき、平均年齢はいったい何歳くらいになるのが自然なのでしょうか。


まずは単純に、20歳〜70歳の年齢の人口が全て同じだったとして確かめてみましょう。

20歳からとしたのは、衆議院議員選挙権を有する国民というところからです。

70歳までとしたのは、70歳以上であれば「職務を辞することができる」からです。

本当は70歳以上である可能性もあるのですから、この切り方だと平均年齢は実際よりも低めに出るわけです。

Excelを使って、20〜70の範囲の乱数を11個ずつ、大量に生成してみました。

f:id:rikunora:20101124021620p:image

こんな感じに、乱数を11人x1000件作成して、

その平均年齢をヒストグラムにまとめた結果が、これです。

f:id:rikunora:20101124021708p:image

赤色のところが年齢34歳以下の部分。

私が試したときには、33歳が1件、34歳が2件でした。

確率で言えば (1+2)/1000 = 0.3% ということになります。


しかし、実際には若い人ほど人口が多くて、高齢者ほど人口が少なくなっているかもしれません。

そこで、東京都住民基本台帳データをもとにして、各年齢の人口比率に比例するように審査員を選んでみました。

* 住民基本台帳による世帯と人口 平成22年1月

>> http://www.toukei.metro.tokyo.jp/juukiy/2010/jy10q10601.htm

住民基本台帳の20〜69歳の分布は、このようになっていました。

f:id:rikunora:20101124021752p:image

その中から、11人x1000件のサンプルをランダムに抜き出した分布は、こうなりました。

f:id:rikunora:20101124021817p:image

だいたい上と同じ形をしています。

このサンプルを元にヒストグラムを作ったところ、こんな結果になりました。

f:id:rikunora:20101124021851p:image

赤色が年齢34歳以下の部分。

32歳が1件、33歳が2件、34歳が8件でした。

確率は (1+2+8)/1000 = 1.1% 。

せっかくなので、もう1回同じことを行ってみました。

f:id:rikunora:20101124021938p:image

結果、30歳が1件、33歳が1件、34歳が6件でした。

確率は (1+1+6)/1000 = 0.8% です。


上のヒストグラムから、たくさんのシミュレーションを行った結果はなんとなく釣鐘型になる、ということが見てとれると思います。

実は、元になる人口の分布がどんな形であっても、そこからたくさんのサンプルを抜き出して作った平均の分布は、釣鐘型の正規分布になるということが知られています。(中心極限定理

今回のサンプル数は11人ですが、それでもかなり釣鐘型っぽいでしょ。

そこで、結果が正規分布になるのだと考えて、年齢が34歳以下になる確率を計算から求めました。

計算方法は、およそ次の通りです。

住民基本台帳から、対象となる東京都民の平均年齢を求める => 43.660 歳となった。

住民基本台帳から、対象となる東京都民の分散を求める => 192.925 となった。

・標本平均の標準偏差 = √{(東京都民の分散)/(11人)} = 4.188

・以上の数字と、正規分布の表から確率を知ることができる。

 Excelの場合「=NORMDIST(34, 43.660, 4.188, TRUE)」と入力すると、34歳以下の確率がわかる。

 その結果は、0.0105、つまり 1.05% だった。

・同様の計算から、34.27歳以下の確率は 1.25%、30.9歳以下の確率は 0.12% となった。

いずれにせよ、こんなことが立て続けに2回も起こったのであれば、

「審査員は無作為に選ばれたとは言えない」と考えるのが自然です。


今回の記事は、ブログ友達である271828さんから教えてもらったものです >> 271828の滑り台Log

以下の切り抜きを送っていただきました。

週刊朝日』-- 10/22より. 桜美林大学教授、数学者 芳沢光雄

・・・まずは住民基本台帳から東京都の20歳から69歳の人(今年元日)を計算しました。

その合計は881万6990人。平均年齢は、43.659歳だった。

そこから数学的な定理(中心極限定理)を応用し計算すると、小沢氏の審査会1回目で出た平均年齢「34.27歳」以下になる確率は「1.28%」。

2回目の「30.90歳」以下になる確率は「0.12%」しかないんです。

あと、以下にある「とある理系の独り言」さんが精度の高い結果を引き出されています。

* 第五検察審査会の度重なる年齢変更について思ったこと

>> http://www.asyura2.com/10/senkyo97/msg/542.html


悩めるみんなの統計学入門 - 統計学で必ず押さえたい6つのキーワード

悩めるみんなの統計学入門 - 統計学で必ず押さえたい6つのキーワード

三毛公爵三毛公爵 2010/11/25 00:10 (´・ω・`)天邪鬼な性格なもので10万分の1という計算の根底がおかしいのではということを色々考えました。

でもさすがに10万分の1を破れる分布の歪み見つけるのは無理そうです。まさに奇跡的数値です。
テレビや新聞もこれくらいの信頼できるデーターで勝負してほしいものですね。

これを自然科学の確率というお話ではなく、人文とか社会科学系で話すと、かなりドロドロになりそうです。

追伸
統計学入門の本!!届きました。現在読み途中ですが、よい勉強になります。美少女も萌えではなくNHK風味なかわいいといった感じですね。大学の研究室で画像処理による特徴抽出という情報系の研究をしている人と話していたら、ミクの統計が分かりやすくてよかったということで、「この人の本なら」とちょびちょび買う人が出てきました。(´・ω・`)b洗脳活動は順調です。

rikunorarikunora 2010/11/26 19:29 さすがにここまでくると、単なる偶然ではかたづけられません。
データの取り方や扱い方によって多少ずれはあるかもしれませんが、大勢は変わりません。
WEB上で検索すると、同じような計算を行っているところが幾つかあって、どこでも似たような結果が出ています。
中には、かなりドロドロした議論に発展しているところもありました。

追伸
工作乙です、ありがとうございます!
> NHK風味なかわいい
なるほど、そういう見方もあったか。

T_NAKAT_NAKA 2010/11/27 13:22 おそまきながら、出版おめでとうございます。なんか羨ましいかぎりです。
さて、この高齢化時代にランダムに選んだ人の平均年齢が30代前半になることの方がおかしいと考えるのが自然ですね。この件については一様分布でやってみようかと思ってましたが、rikunora さんの記事の方が説得力があります。
ところで、rikunora さんのこの記事で全然違うところに反応してしました。
「東京都の人口構成」で 43 才の人口が不連続に少ないのは、丙午の迷信ですね。
http://teenaka.at.webry.info/200703/article_8.html
こういうところでも統計は嘘をつけません。たまたま 1966 年生まれの人の出生率が例年より下がってしまう確率もゼロではありませんが、これは有意と考えるのが自然です。「小沢検察審議会の平均年齢」も自然でないということだと思いますね。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証