ブログトップ 記事一覧 ログイン 無料ブログ開設

agwの日記 RSSフィード

2011-12-04 Expectation of a binomial random variable X

agw2011-12-04

Expectation of a binomial random variable X

数学を考えるとき、公式を自分で導くことができると有利であることが多いように感じます。そのため、自分の感覚と合う計算方法と出会えたときは嬉しいものです。

例えば確率pで成功する実験をn回独立に行うことを考えてみましょう。成功する回数を確率変数Xで表すとき、Xの分布は二項分布となります。

f:id:agw:20111204165455p:image

8割の確率でシュートを決めることのできるバスケットボール選手が10回のシュートを行ったとき、k回のシュートが成功する確率の分布は二項分布に従います。

f:id:agw:20111204203405p:image

二項分布からは様々なことを知ることができます。例えばこの選手が10回全てのシュートを成功する確率は大体10%です。また、この選手が5本以下のシュートしか成功出来ない確率P(X <= 5)は、計算するとおよそ12%となります。


二項分布の期待値を求める公式は非常に直感的です。例えば先ほどの選手が10回のシュートを行ったとき、成功する回数の期待値は8回となります(期待値は最頻数に必ずしも一致しないので注意してください)。

f:id:agw:20111204135004p:image

一件簡単そうに見えるこの公式ですが、導くにはなかなか骨が折れます。例えば確率と計算が紹介している計算方法はそれなりに難解です。

f:id:agw:20111204135335p:image


さて、先日Khan AcademyExpected Value of Binomial Distributionを視聴していたときに、計算の前半が自分にとって理解しやすいように感じました。そこでKhan Academyでの計算と確率と計算での計算を織り交ぜつつ導いてみました。

定義から、離散確率変数Xの期待値E[X]は以下で与えられます。

f:id:agw:20111204153523p:image

これを使って、二項分布の期待値を以下のように計算します。

f:id:agw:20111204135005p:image

kの範囲は[0, n]です。しかしkが0のときの値は総和に寄与しません。そのため、総和の範囲を[1, n]とすることができます。

f:id:agw:20111204135006p:image

さて、二項係数は以下のように階乗で表すことができるのでした。

f:id:agw:20111204135302p:image

これを使って式の中の二項係数を置き換えます。

f:id:agw:20111204135007p:image

k!をk(k - 1)!とおいて、kを消してしまいましょう。

f:id:agw:20111205144148p:image

ここでa = k - 1とおいて、k - 1とkを消してしまいましょう。k = a + 1であることに注意すると、

f:id:agw:20111204135009p:image

n - (a + 1)から意図的にn - 1を括りだそうとしていることにも注意してください。

さらにn!をn(n - 1)!と置き換えて、nを総和の外に吐き出してしまいましょう。また、pa+1もppaと置き換えて、pを総和の外に吐き出してしまいましょう。

f:id:agw:20111204135010p:image

次にb = n - 1とおいて、n - 1を消してしまいましょう。

f:id:agw:20111204135011p:image

再度二項係数が現れました。置き換えてみましょう。

f:id:agw:20111204135012p:image

この式の後半は二項定理そのものです。

f:id:agw:20111204135014p:image

x = p、y = 1 - p、n = bとして二項定理で置き換えましょう。無事目的の式が計算できました。

f:id:agw:20111204135013p:image

まとめると以下になります。

f:id:agw:20111206224726p:image

まとめ

今回のエントリでは二項分布期待値を計算しました。

二項分布の期待値自身は期待値の線形性を利用するともっと簡単に計算することが可能です。しかしこのエントリで紹介した計算方法は確率変数Xの二次積率、E[X2]を計算するときに応用することができます。二次積率は一様分布や二項分布の分散を計算するときに必要となります。


さて、今回のエントリで紹介したKhan Academyによる二項分布の期待値の計算は以下から視聴できます。

このエントリを記載するにあたり以下の書籍を参考にしました。Khan Academyの計算を補完したほとんどのアイデアは確率と計算から発想を得ています。

確率と計算 ―乱択アルゴリズムと確率的解析―

確率と計算 ―乱択アルゴリズムと確率的解析―

Probability and Computing: Randomized Algorithms and Probabilistic Analysis

Probability and Computing: Randomized Algorithms and Probabilistic Analysis

アルゴリズムイントロダクション 第1巻の付録Cでは数え上げと確率を明瞭、簡潔に解説しています。

また、このエントリを記載するにあたり以下のページを参考にしました。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証