Hatena::ブログ(Diary)

sleeping vote このページをアンテナに追加 RSSフィード

2009-07-10

[][][]東京都議会議員選挙の党派マニフェストを自動分類したよ

これはなに?

2009年7月12日投開票の東京都議会議員選挙において、主要6党(自民党、民主党、公明党、共産党、幸福実現党、生活者ネットワーク)の会派マニフェストに書いてある内容を品田方式と呼ばれる選挙研究で使う分類カテゴリに従い、分類したものです。

各党のマニフェストで、政策カテゴリ別に言及割合を出すことにより、どの政策に、政党がどれだけ興味があるかを割り出して、政党の政策位置を推定できるということが期待出来ます。

分類作業は、stiqが研究している自然言語処理機械学習*1の方法を用いて自動分類コーディングシステムを構築し、それを使っています。

自動分類コーディングシステムを構築することによって、人手による分類によって数ヶ月掛かっていた作業が、1日で終わり、公示日ごろに発表されるマニフェストをすぐに分類処理して、投票日までに分類データを作ることが出来ます。

次期衆院選についても、同様の分類を行う予定です。

学術論文

具体的に、このシステムについては、これらの論文に仕組みが書かれています。

出典:日本版ボートマッチ ワーキング・グループより

また、この分類に用いている分類カテゴリについての論文は、

  • 選挙公約政策データについて」 品田裕. 2006. 『日本政治研究3(2)』, 63-91頁.

に基づいています。

おことわり

今日公開するデータは、東京都議選に合わせて、システムのテスト運用をこめて分類した結果であり、それの速報版です。

細かいところまでのデータの検証はできていませんので、ご了承ください。

研究目的でご利用の場合やマニフェスト分類について、詳しく知りたい方はお知らせください。

mail : stiq2e atmark gmail.com

または、http://tai.ia.inf.shizuoka.ac.jp/にある連絡先へ


各党政策言及割合

政策対象

政党が誰に向けた政策なのかを分類したものです。

f:id:stick23rd:20090711221403p:image

f:id:stick23rd:20090710155014p:image

政策分野(大分類)

政党がどのような政策をマニフェストに書いているのかを、大きな分野別にまとめたのものです。

f:id:stick23rd:20090711221600p:image

f:id:stick23rd:20090710155012p:image

政策内容(小分類)

政策分野(大分類)をさらに細かいカテゴリで分けたもの

こんな感じのデータです。

f:id:stick23rd:20090711221646p:image

くわしくは、ダウンロード先にある資料をご覧下さい。

言及数と候補者数

都議選における各政党のマニフェストの分量と候補者数

f:id:stick23rd:20090711221724p:image

自民党のマニフェストの分量が突出して多いです。


上記結果のダウンロード

http://stiq.info/labs/tokyo_manifesto2009_3rd_edtion.zip

繰り返しになりますが、このデータを研究目的で使いたい場合は、必ず上記連絡先へお知らせください。

追記 (7月11日土曜日21時40分)

この記事を紹介していただきました。そのトラックバック先より、

私はグラフよりも[カラースケール]機能のほうが、より見やすいと感じました。

投票支援ツール−東京都議会議員選挙の党派マニフェストの政策分類結果 - インストラクターのネタ帳

とありましたので、参考にさせていただきました。言及割合が高いものに色をつけました。

また、他にも候補者数のデータもあると良いという助言いただいたので、調査して、参考の為に数値を載せました。

ダウンロード先のデータも入れ替えました。

よろしくお願いします。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証