svnseeds’ ghoti!

人工無脳Ghoti / Jazz Drum Solo Transcriptions / svnseedsのアンテナ
[自然言語処理] [経済/金融] [] [cygwin]
2003 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 |
2009 | 02 |
2010 | 06 |

2008-01-16

[]失業率と犯罪率 G7版



【1月18日追記あり。本エントリ最後をご参照】



例の松尾先生のところのアレですが、ブクマコメントにあるように僕も国際比較を見てみたくなったので急遽でっちあげてみました。実働5時間くらい*1の超大作です【そんなにヒマとはsvnseeds】。

とりあえず米国、英国*2、ドイツ、フランス、イタリア、カナダ、日本のG7諸国を調査対象としました。

失業率と犯罪発生件数との相関を見るのはやはりちょっと気持悪いので、ここでは失業率と犯罪率(人口10万人あたりの犯罪発生件数)でみています。

データを探すのが面倒だったので、主に1980年から2006年(国によっては2001年もしくは2005年まで)のデータを用いています。

また、これも面倒なのでt値とp値は計算してません。わはは。【計算してみました。1月18日追記参照】

で、この手抜きサーベイで得られた知見は;

  • 日本の失業率と犯罪率は非常に高い相関を示している
  • 日本以外のG7諸国においては失業率と犯罪率の相関は高いとはいえない(英国では逆相間になっている)

といったところでしょうか。

また、知見とはいえませんが以下の点は面白そうなので誰か調べてくれないかなあ【他力本願のsvnseeds】。

  • 特にフランスにおいて顕著だが、犯罪率が失業率に先行して増減しているように見える現象が観察された
  • 英国、ドイツ、カナダにおける1980年代半ばあたりまでの失業率と犯罪率の著しい乖離(高い失業率と低い犯罪率)や英国の1998年以降の逆の乖離(低い失業率と犯罪率)は社会保障政策と関係ありそうな気がしないでもない

最後にまとめてすべてソースを記してしておきますので、懐疑的な方やりてらしーのたかいかた(棒読み)はご自分で是非お調べいただきたく。IMFと英国Home Officeのデータを使えば、1980年から2001年の間であればG7以外の国について調べるのも容易と思います。

ではいってみましょう。



日本は犯罪率でみてもやっぱり非常に高い相関を示しています。決定係数はなんと0.8816。

f:id:svnseeds:20080116231114p:image

【図:日本の失業率と犯罪率 時系列 1980-2006年】

f:id:svnseeds:20080116231113p:image

【図:日本の失業率と犯罪率 相関 1980-2006年】



米国。決定係数は0.3107。相関良いとはいえません。でも特に1990年以降はトレンドとしては一緒に動いているように見えます。

また今回は直接関係ないネタですが、こうして並べてみると米国の失業率の変動の激しさというか景気動向に敏感な点はやはり際立ってますねえ。

f:id:svnseeds:20080116231112p:image

【図:米国の失業率と犯罪率 時系列 1980-2006年】

f:id:svnseeds:20080116231110p:image

【図:米国の失業率と犯罪率 相関 1980-2006年】



英国。データが見つからず1980-2001年の数字を用いています。この期間のデータでは逆相関になってしまうのが面白い(決定係数は0.1384)。1989年以前と1998年以降の乖離って何が原因なんですかねえ。

また、註にも書きましたが犯罪発生件数はNorthern IrelandとScotlandを除くEnglandとWalesの数字を使っているのであまり信頼性のない結果になっています。ご注意。下記ソースにはちゃんと数字あるんで誰か計算し直して下さい。

f:id:svnseeds:20080116231252p:image

【図:英国の失業率と犯罪率 時系列 1980-2001年】

f:id:svnseeds:20080116231251p:image

【図:英国の失業率と犯罪率 相関 1980-2001年】



ドイツ。これも相関よくないです。決定係数は0.1508。

1990年以降は旧東ドイツ併合により犯罪率、失業率とも大幅に上昇しているためデータに一貫性がないことが影響しているかもしれません。

f:id:svnseeds:20080116231248p:image

【図:ドイツの失業率と犯罪率 時系列 1980-2006年】

f:id:svnseeds:20080116231245p:image

【図:ドイツの失業率と犯罪率 相関 1980-2006年】



フランス。こちらは1980-2005年のデータ。これも相関良いとはいえません(決定係数は0.1064)。

この期間犯罪率が失業率に対して2-3年先行しているように見えるのが非常に興味深いです。統計の取り方に原因があるんでしょうか。ちなみに犯罪率を2年先行させて調整すると決定係数は0.3790になります。

f:id:svnseeds:20080116231404p:image

【図:フランスの失業率と犯罪率 時系列 1980-2005年】

f:id:svnseeds:20080116231406p:image

【図:フランスの失業率と犯罪率 相関 1980-2005年】



イタリア。データが見つからず2001年まで。今回の調査対象の中では日本についで相関が良いです(決定係数は0.5355)。

1999年以降失業率が大きく減少しているので2001年以降の犯罪率を見てみたいところ。1992年をピークとする乖離も興味深いです。

f:id:svnseeds:20080116231401p:image

【図:イタリアの失業率と犯罪率 時系列 1980-2001年】

f:id:svnseeds:20080116231359p:image

【図:イタリアの失業率と犯罪率 相関 1980-2001年】



最後にカナダ。1980年から2006年の期間では決定係数は0.3787。1990年以降をとるとかなり良い相関を示しそうです。ちょっとだけ犯罪率が先行しているように見えるのも興味深いです。

f:id:svnseeds:20080117002842p:image

【図:カナダの失業率と犯罪率 時系列 1980-2006年】

f:id:svnseeds:20080117002841p:image

【図:カナダの失業率と犯罪率 相関 1980-2006年】


あー疲れた。では皆さんごきげんよう。



【データソース】

括弧内はそのソースのデータを使用した年を示す。


【1月18日追記】

矢野さんにコメントいただきましたので、せっかくだからp値とダービン・ワトソン統計量を求めてみました。

以下まとめておきます。

国名対象期間相関係数決定係数p値DW値
日本1980 - 20060.9390.8820.0000.603
米国1980 - 20060.5570.3110.0030.216
英国1980 - 2001-0.3720.1380.0880.264
ドイツ1980 - 20060.3880.1510.0450.130
フランス1980 - 20050.3260.1060.1040.494
フランス(註)1980 - 20050.6160.3790.0010.408
イタリア1980 - 20010.7320.5360.0000.501
カナダ1980 - 20060.6150.3790.0010.371

(註)犯罪率を2年先行させたもの

矢野さんのところのコメント欄の松尾先生のコメントにもありますが、ごらんいただければわかるように、どの調査対象データもダービン・ワトソン検定により正の系列相関を示している、という結果になりました。残念無念なり。

残差に系列相関が認められる場合は色々な統計的処理で回避可能らしいんですが、これ以上はちょっと僕の手に余る感じでございます。この続きをやってくれる勇者(または学者)はいないものでしょうか。って僕に言われなくても絶対誰かやってますかそうですか。

なお言わずもがなのdisclaimerですが、上記数字は統計・計量経済学素人のsvnseedsが下記リンク等を参考に猿真似で計算したものですので、これらに基づいて何かを言いたい方は是非ご自分で検算するようお願いいたします。

最後になりましたが矢野さん、いつもコメントありがとうございます。また変なこと書いていたらご指摘いただければ嬉しいです。

*1:内訳:データ見つけるのに2時間、データ整理するのに1時間、グラフ作るのに2時間(笑)。

*2:犯罪発生件数としてEngland & Walesのデータを使いましたがNorthern IrelandとScotlandも加えるべきだったかもしれません。

うーむうーむ 2008/01/17 15:44 これに移民の数を織り込むとまた興味深い数字が出てくるのですかねぇ

kumakuma1967kumakuma1967 2008/01/18 09:06 「社会保障政策と関係ありそうな気」の件ですが
http://labor.tank.jp/sonota/kaigaitokei01.html
によるとイギリスの失業者の定義が
「原則として18歳以上で過去4カ月以内に仕事がなく、かつ就業可能な者で、職業安定所に求職者手当を申請し、受給資格を得た者。」ですから、「受給資格」の変化で統計の連続性がなくなってる影響もありそうですね。

kumakuma1967kumakuma1967 2008/01/18 09:59 ↑あ、確認したらIMFのソースはILO準拠の方の数字でした。誤誘導ゴメンナサイ。
それはそれで、有給職業訓練参加者が失業者から抜けた影響などを見ないといけないわけですが。

svnseedssvnseeds 2008/01/18 20:57 うーむさん、kumakumaさん、どうもですー。

移民とか社会保障政策とか、やっぱり犯罪率は失業だけじゃなくて他の影響も見てみないとダメっぽい感じですね。後でエントリに追記しますが、上に挙げた相関関係はすべて系列相関が見られるので、このままでは何もいえないことになってしまいました・・・。

大竹先生のところでは日本の犯罪率と失業率の年齢別の関係についての実証研究が紹介されていましたね。

http://db.jil.go.jp/cgi-bin/jsk012?smode=dtldsp&detail=F2003080121&displayflg=1

まあ犯罪率を年齢別にbreak downしようと思うと、定義により認知件数でなく検挙件数をベースにしなくてはならないところがもどかしい点ではあります。つくづく統計って奥が深いよなあ・・・。