eliyaの日記

2011-01-03

カリブレーションと推定の違いについて 14:09

仕事上必要になって、説明のためのメモを準備していましたが、せっかくだからアップロードしようかと。「マクロ経済学、特にDSGEモデルの作成におけるカリブレーション(calibration)と推定(estimation)の違い」で検索したときに、ぱっとわかりやすいコンテンツが出たら、誰かの役に立つのではないかと。

同じ点

統計的推定を一番広い意味で定義すると、「データを用いてモデルのパラメータを決定する*1」となると思います。その意味では、カリブレーションと推定は同じです。

違う点

結論から言うと、一番違うのは研究者の気持ちだと思います。それに伴って具体的な手順が異なる。推定のときと違って、カリブレーションのときは、モデルが「現実の上手な近似」であると信じていないんじゃないかな。もうちょっと具体的にみてみましょう。


推定

一般的な統計的推定の手順を述べます。

  1. 未知のパラメータを含むモデルを決定する
  2. モデルからの予測値と現実のデータの何らかの意味での「距離」を測定する。
  3. 「距離」が最小になるようなパラメータを選ぶ
  4. パラメータの信頼度をチェックする。信頼度は、距離の定義、およびモデルの立て方から自動的に決定される。

以上の手順は標準的なものが定まっており、基本的には同じように距離を測定し、同じように信頼度をチェックします。


カリブレーション

カリブレーションはいくつか方法がありますが、典型的なものをひとつ。

  1. 未知のパラメータを含むモデルを決定する。
  2. 一部のパラメータは今までの研究の積み重ねに基づいて天下り的に与える
  3. 常識で決められないようなパラメーターは何とかして決定する。このステップはいくつか方法があり、一番望ましいのは、モデルが示唆するモーメント(例:平均失業期間)と、データの平均失業期間が合うようにパラメーターを調整するものです。これを用いると統計的推定のモーメント法とかなり近くなる。適切なモーメント(例:前職の勤続年数と収入に応じた平均失業期間)がデータから得られない場合は、研究者が個人の勘でえいやと設定してしまうこともある。
  4. パラメータ設定時や、モデル作成時に置いた仮定の妥当性を、モデルの振る舞いをデータと比較することで改めてチェックする。
  5. 自分と他人が納得いくまで1-4を繰り返す。

どっちがいいの?

一般論としては、推定のほうがより正式で、より信頼できます。でも、マクロでは現実問題として推定できないことが多くあります。まず挙げられるのはデータの制約です。推定しようにも十分なデータがないと何もできません。

また、理論上の制約により、「これが十分に現実のマクロ経済と似ている」と自信を持って言えるレベルになりません。合理的期待は明らかに現実と反していますが、代わりにもっとよい期待のアイディアはありません。現実に売られている商品の多様性を十分に表現することも不可能です。政府の行動は選挙や個々の政治家の思惑も絡んだ複雑なプロセスですが、それを定量的に予測するまでのモデルの洗練はありません。


正式に、きちんとした手順でパラメーター決定ができない以上、いわゆる「ベテランの名人芸と過去の知恵」に頼るしかないわけですが、それにカタカナ語でかっこいい名前をつけると、カリブレーション、になります。



データの制約について

閑話休題。マクロ経済ではデータが足らないとよく言われます。以前はそれがとても不思議でした。「経済の先行きや政策効果の予測って、何十兆円の世界でしょう。なんでデータを作らないわけ?」


昔の私に向けて、少し説明を。一番ほしいデータを得るために必要なのは、今の地球をコピーしたものを数百-数万個と、タイムマシンを一台です。それぞれの地球の日本で、いろいろな政策を試してみて、数年後にワープし、結果を測定します。これができれば経済学は医学と同じくらい定量予測が信頼できるようになるでしょう。


次善のデータもあります。個人(数万から数百万人)の詳しい行動データです。毎週、食べ物にいくら使って、家を買うためにいくら貯蓄して、給料は年とともにどのように変化して、残業は週に何時間で、貯金額は証券会社にYY円で、結婚したら食費はどのように変化して、といったデータ。これが自由に使えればおそらく天気予報と同じくらいにはマクロ経済学も信頼できるようになるでしょう。

このデータは、お金的にはおそらく数十億から一千億円程度でできますが、プライバシーの問題が発生します。特に日本では研究目的だからといって自由に使えるようなデータではありません。


それもないときは、「平均進学率」とか、「平均残業時間」とかのデータを使うわけですが、平均なんたら、というのは変数間の関係が失われていて、データ的にはかなり使いづらいデータになります。

*1:パラメトリックなモデルを仮定。以下同じ。

ShujiShuji 2011/01/03 18:29 こんにちは、もう更新されないかと思っていたので久しぶりに拝読できてうれしいです。

私も留学先でマクロ経済学を学んで(といってもMajor持ってるやつに言わせれば学部の入門レベルらしいですが)、興味を覚えました。

記事内容ですが、カリブレーション=モデル中の従属変数とパラメーターを一部仮定してしまう、という理解でよろしいでしょうか?

あと、ちなみに日本って例えばアメリカと比べてそもそも調査データが非常に少ないとか、調査予算が少ないとか(これは経済規模からやむをえないような気がしますが)、仮にデータがあっても利用ルールが煩雑である、などあるんでしょうか?そういう嘆きを友人の経済学者からよくききましたので。

eliyaeliya 2011/01/03 21:58 コメントありがとうございます。これからどうなるかわかりませんが、地味に更新していきます。

経済学は初級と上級が面白いです。楽しんでくださいね。

従属変数とは回帰分析の右辺の変数ってことでしょうか。それは仮定しません。パラメータは仮定してしまうこともあります。もちろんそのあと妥当性チェックはありますが。

アメリカは自由に使えるデータが充実していてうらやましいです。日本もデータそのものは官庁が作っていますよ。企業の全数調査とかしてるので、世界中の研究者の垂涎の的じゃないですかね。ただ、官庁が抱え込んでいて民間の研究者は基本的に使えないと言われました。委託研究か、付属研究所に所属したりしないとだめだと。それならそれで彼らがきちんとした分析してくれれば文句はないんですけど。