INVISIBLE D. ーQUIET & COLORFUL PLACE-

John 8:32 Then you will know the truth, and the truth will set you free."  複数ブログの過去記事を移管し、管理の委託を受けています/※場合により、語る対象の「ネタバレ」も在ります。ご了承ください 

「世論調査」徒然草(14日の民主党代表選挙を前に)

早いもので明日が、民主党の代表選になる。
いくつかのメディアや識者が、この代表選では「新聞や通信社、テレビ局の世論調査とインターネット投票の結果に差がある(前者は菅直人支持、後者は小沢一郎支持が多数)」ということを記事にした。

http://sankei.jp.msn.com/politics/policy/100909/plc1009092108016-n1.htm
http://diamond.jp/articles/-/9325
http://www.j-cast.com/2010/09/12075643.html


世論調査や統計、確率論にまつわるおもしろ話はこのブログの持ちネタのひとつで、
http://d.hatena.ne.jp/gryphon/20100907#p4
をはじめ
http://d.hatena.ne.jp/gryphon/20081112#p5
http://d.hatena.ne.jp/gryphon/20100213#p4

などでかいています。いつかは関連書を読んで面白かったことを体系的にまとめたかったけど、ちょっと時間がないまま、明日がその日となってしまった。

だもんで、新聞で読んだトピックなんかも交えて、今まで読んだ本の中で印象深かったものを「徒然草」方式で短文で書こうと思う。

渡辺喜美の政党「みんなの党」は、特に発足当初は新聞ごとに支持率が大きく違った。これは、政党支持を聞くときに「支持政党は?」と聞きっぱなしにする社と「支持政党は次のうちどれですか?A:自民党、B:民主党…」と聞く社があり、当然後者が高くなる「渡辺さんの・・・なんだっけ・・・あの党は・・・」みたいな人がいるってこと。

選挙関連で世論調査が初めて大きな注目を浴びたのは1936年、民主党ルーズベルトvs共和党ランドン。あるメディアは300万人をも対象に調査士、ランドン勝利を予測したが結果はルーズベルト勝利。この時、そこは大規模に「電話調査」をしたのだが、当時は電話を持つ家=富裕層という偏りがあった(笑)。ちなみに今もつづくギャラップ社はサンプリングを厳密に行い、1000人規模の調査でルーズベルト勝利を予測。「数の多さよりランダム・サンプリング」を決定付けたといわれる。

村上ファンド阪神電鉄を買収した際、タイガース上場の是非が議論になった。ライブドアで賛成7割、反対25%。ライブドアは当時、創始者ホリエモンのイメージが強い。既成勢力に挑む新興実業家、という点で堀江と村上はイメージの共通性があり、ライブドアの投票者はホリエモンファン→村上にも好意的 との偏りがあった。ちなみにデイリースポーツの調査では反対93%。どういう偏りかはいうまでもない(笑)

これは真面目な話、もっと厳密な世論調査でも発生する。比べてみると内閣支持率や政策では、その新聞の論調に応じた数%の差が出ることが多い。これはその社が操作してるとかの陰謀論より(笑)、回答をお願いするとき、一定の人数は「朝日の調査?わしゃアカい朝日は嫌いじゃ!!がちゃん」「ヨミウリ?ナベツネ氏ねや!!ガチャン」…と、その社の論調が嫌いな人の回答がやや減るためであろう、と推測されている。

漫画「かってに改蔵」で「”セクシーな服”のアンケートをとったら、他の町ではボディコンなのに、なぜか秋葉原だけメイド服がダントツ一位」というネタがあった(笑)。いやこれ、「世論調査と母集団」の問題を分からせるために、マジにいい例ですよ(笑)

河野太郎は2006年、総裁選に推薦議員ゼロで名乗りをあげ、政策を発表するという奇手に出た(規定上、20人が推薦しないとそもそも立候補できない)。政策をメディアで訴えて「次の首相に期待する人」の世論調査で、谷垣禎一麻生太郎を抜くことで泡沫から抜け出ようというものだった。このとき河野は「世論調査が予備選だ」と語った。で、実際にTBSや毎日新聞の調査では現総裁・谷垣の上にいったのだが・・・ああなんということでしょう、他社はそもそも選択肢の中に入れなかった(笑) 実際に「選択肢」で世論調査は変わる。

上の河野太郎や「みんなの党」にも関わるのだが、あるとき朝日新聞の調査で、トップの支持率だった安倍晋三につづく2番手に福田康夫が浮上、一躍注目を集めた。ただ、それは以前は自由回答で候補を挙げていたものを、その時から選択肢を用意して選ばせたためのものだった。とくにリベラル層などが、民主党社民党党首の選択肢がなくなると、次善として親中派の福田を選ぶなどが起きる

そういう点では、「状況に応じて柔軟に選択肢や設問を変えるか」「過去との継続性、変化をみるために設問をムリにでも長く変えないか」は永遠の議論。

1999年(だったかな)、アメリカで「存命中の元大統領で最も貴方が尊敬する人は?」との調査で、トップだったのがカーター。外交特使などの活躍が評価された・・・というより米国が民主・共和の二大政党支持者が多い中、その時点での元大統領は、民主では当時カーターのみ。共和はレーガン、ブッシュ父、ニクソン、フォードと複数が存命だった。福田康夫の支持上昇もそうだが、選択肢の分散や集中による変化、偏りは注意点のひとつ。

現在、世論調査の主流…とはいわなくとも存在感があるのはPDD。電話調査だが、電話帳などではなく、ランダムに03-1234-・・・といった感じでコンピューターが電話番号を設定して電話をかけ、質問を発する。これはコスト減もあるが、何より「すぐ準備できる」のが強み。というか緊急に世論調査をするには、これじゃないとできない。また調査の回数が「毎週」「毎月」ペースになったのも、この技術の発達のため。

しかし、いまだにその対象は固定電話。もう携帯電話しかない世帯も多い今、その層はそもそも調査しにくい・・・のが現在の世論調査の一番の悩みのたね。

ある比率の精度をプラスマイナス5%の誤差で推定する場合、どんなに母集団が大きくても、400弱(正確には384程度)のサンプルが無作為抽出できれば十分だといわれてるそうだ。
さて、この「誤差5%」を「誤差1%」にまで高めるときはどのぐらいサンプルを増やすべきでしょう?…実は5の二乗、25倍にサンプルを増やさなきゃいけないんだってさ。理由はしらん。

もともと世論調査というのは「それが本当に正しいの?」と聞かれても多くは証明しにくい。そういう点で、衆院選参院選などの最終結果と、事前の各社の予測は「答え合わせ」の機会でもある。だから各社は力を入れる。

ただ今回の代表選は議員・党員・サポーター選挙であるから、ランダムサンプリングの世論調査とは違いが出て当然。各社の情勢予測は世論調査も参考にしてるだろうけど、基本は政治部記者などの旧来的な取材が主な予測の根拠であろう。ある意味旧来政治部に力があればあるほど正確かも(笑)。

つーかもしも、議員はともかく一般党員・サポーターの投票結果が世論調査とあんまり差があるときは「みたか大メディア、世論調査!」というよりは「民主党の内部って、こんなに一般世論とかけ離れてるのか」が正しい推論かも(笑)

最近、事前の世論調査と結果が選挙で大きくずれたのは橋本龍太郎首相が退陣に追い込まれた参院選小泉純一郎郵政解散、外国ではスペインで政権交代が起きた2004年選挙。ただ、これらは世論調査が違っていたというより、解散や選挙期間中のテロ、発言のぶれなどで大きく世論自体が変化したことが大きい。

そもそも、世論調査はあてにならん!と政治家はいいつつ、けっこう自分たちの選挙の時はやっぱり調査会社に頼って詳細・精密なデータを作り、てこ入れや遊説先決定の参考にしている。この時はやっぱりランダム・サンプリングを使い、ネットのアンケートは参考にしないらしい(笑)


今回の民主党代表選、または「世論調査vsネットアンケート」を見るときの参考になったでしょうか。書いているこっちは、けっこうおもしろがって書けたのだが、読んでいる方も多少面白がってくだされば幸いです。


【付記】コメント欄から。何かの暗号。

Poet 2010/09/13 11:47
サンプリングされたN人のうちM人が、誰かや何かを支持している場合、支持率の推計はR=M/Nになる。何回もサンプリングをやり直ししたと仮定すると、そのばらつきはN>30以上の場合、ガウス分布するので、標準偏差がR×(1-R)/Nの平方根になる。サンプル数400人、支持率50%の時はN=400, M=200, R=0.5なので、標準偏差は2.5%。これは推計値±2.5%に真の支持率がある確率が68%という意味で、標準偏差の2倍、推計値±5%の中に真の支持率がある確率は95%。逆に言えば、20回に1回くらいは誤差よりも大きく間違う。
これは統計誤差と呼ばれ、サンプリングの偏りなどによる系統誤差が
別に存在する。視聴率調査なんかも600世帯のサンプリングだから、統計誤差だけで数%あるわけですね。

あっ、こういうときにこれを使うのか。

参考文献

書くにあたっては、これらの本の中から大いに知識を得ました。細かい数字の違いなどがあったら、たぶん当方の責任です。
http://d.hatena.ne.jp/gryphon/20100906