このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

モデル点における期待値

Eθ[ψ(X)] という記号がある。これを解釈する。

やっぱり用語記号が分からない - 檜山正幸のキマイラ飼育記 メモ編検定関数の汎関数 - 檜山正幸のキマイラ飼育記 メモ編 にも出てくる表現だ。

まず、測度μに対する可測関数fの積分 I(f, μ) を次の2つの記号で書く。

  1.   I_{X}(f, \mu) = \int_{X} f(x)d\mu
  2.   I_{X}(f, \mu) = \int_{X} f(x)\mu(dx)

2番めの書き方は、可測空間X上に基準測度があって、それをdxと書いているつもり。したがって、μ(dx) は測度的微分形式で、dxに関するμの密度関数pを用いて μ(dx) = p(x)dx と書ける。p(x) を積分した関数をF(累積分布関数)とすれば、μ(dx) = dF(x) とも書ける。

  • dμ = μ(dx) = p(x)dx = dF(x) (Fの導関数がp)

Xが確率変数 U→V のとき、U上の測度μの前送りを次のどちらかで表す。

  • X*(μ)
  • μX

確率変数(可測写像)Xによる関数の引き戻しと測度の前送りに関して、

  • IU(X*(g), μ) = IV(g, X*(μ))

という随伴性が成立する。測度と関数の双対性ともいえる。

X*(g) を g(X) とも書く。すると、

  • IU(g(X), μ) = IV(g, X*(μ))

積分記号で書くと:

   \int_{U} g(X)d\mu = \int_{V} g(x) p(x)dx

g(X)は合成関数としての確率変数。この積分は確率変数の期待値なので、

  E[g(X)] =  \int_{U} g(X)d\mu = \int_{V} g(x) p(x)dx

“母集団”Uと確率変数Xを忘れて、すべてV上で考えると、

  E[g] = \int_{V} g(x) p(x)dx

という定義ができる。これは、V上の可測関数gの“期待値”となる。p(x)dx が期待値を求めるための測度(値の重み付け、分布、物体)。

確率分布pによる期待値なので、

  E_{p}[g] = \int_{V} g(x) p(x)dx

pとgを対等に考えて、

  J(g, p) = E_{p}[g] = \int_{V} g(x) p(x)dx

J(-, -) は、可測関数の空間と密度関数の空間のあいだのスカラー積。関数と密度の双対性を与える。

密度関数の族がパラメータ空間Θでパラメータ表示されているとする。M = {pθ∈{密度関数}| θ∈Θ} という形。パラメータθを含む期待値は、

  J(g, p_{\theta}) = E_{p_\theta}[g] = \int_{V} g(x) p_\theta(x)dx

ここで、θ|→ pθ は統計モデルそのものなのでいちいち書かないことにして、汎関数であるJ, Eにパラメータθを押し付ければ、

  J_{\theta}(g) = E_{\theta}[g] = \int_{V} g(x) p_\theta(x)dx

これで、θでパラメトライズされた汎関数の族 Jθ, Eθ ができた。汎関数の空間は、関数(可測関数)の空間の双対なので、双対空間に値を取るパラメータ族、つまりモデルが出来る。

パラメトリックモデルでは、パラメータ値はモデルを特定するので、モデル点ごとに異なる期待値汎関数を持つことのなる。パラメータ値θに対応するモデルにおける期待値がEθ。これはまー当たり前の話だが、記号法がややこしい。