agwの日記

Expectation of a binomial random variable X

Probability !

数学を考えるとき、公式を自分で導くことができると有利であることが多いように感じます。そのため、自分の感覚と合う計算方法と出会えたときは嬉しいものです。

例えば確率pで成功する実験をn回独立に行うことを考えてみましょう。成功する回数を確率変数Xで表すとき、Xの分布は二項分布となります。

8割の確率でシュートを決めることのできるバスケットボール選手が10回のシュートを行ったとき、k回のシュートが成功する確率の分布は二項分布に従います。

二項分布からは様々なことを知ることができます。例えばこの選手が10回全てのシュートを成功する確率は大体10%です。また、この選手が5本以下のシュートしか成功出来ない確率P(X <= 5)は、計算するとおよそ12%となります。

二項分布の期待値を求める公式は非常に直感的です。例えば先ほどの選手が10回のシュートを行ったとき、成功する回数の期待値は8回となります(期待値は最頻数に必ずしも一致しないので注意してください)。

一件簡単そうに見えるこの公式ですが、導くにはなかなか骨が折れます。例えば確率と計算が紹介している計算方法はそれなりに難解です。

さて、先日Khan AcademyのExpected Value of Binomial Distributionを視聴していたときに、計算の前半が自分にとって理解しやすいように感じました。そこでKhan Academyでの計算と確率と計算での計算を織り交ぜつつ導いてみました。

定義から、離散確率変数Xの期待値E[X]は以下で与えられます。

これを使って、二項分布の期待値を以下のように計算します。

kの範囲は[0, n]です。しかしkが0のときの値は総和に寄与しません。そのため、総和の範囲を[1, n]とすることができます。

さて、二項係数は以下のように階乗で表すことができるのでした。

これを使って式の中の二項係数を置き換えます。

k!をk(k - 1)!とおいて、kを消してしまいましょう。

ここでa = k - 1とおいて、k - 1とkを消してしまいましょう。k = a + 1であることに注意すると、

n - (a + 1)から意図的にn - 1を括りだそうとしていることにも注意してください。

さらにn!をn(n - 1)!と置き換えて、nを総和の外に吐き出してしまいましょう。また、p^a+1もpp^aと置き換えて、pを総和の外に吐き出してしまいましょう。

次にb = n - 1とおいて、n - 1を消してしまいましょう。

再度二項係数が現れました。置き換えてみましょう。

この式の後半は二項定理そのものです。

x = p、y = 1 - p、n = bとして二項定理で置き換えましょう。無事目的の式が計算できました。

まとめると以下になります。

まとめ

今回のエントリでは二項分布の期待値を計算しました。

二項分布の期待値自身は期待値の線形性を利用するともっと簡単に計算することが可能です。しかしこのエントリで紹介した計算方法は確率変数Xの二次積率、E[X²]を計算するときに応用することができます。二次積率は一様分布や二項分布の分散を計算するときに必要となります。

さて、今回のエントリで紹介したKhan Academyによる二項分布の期待値の計算は以下から視聴できます。

Expected Value of Binomial Distribution

このエントリを記載するにあたり以下の書籍を参考にしました。Khan Academyの計算を補完したほとんどのアイデアは確率と計算から発想を得ています。

確率と計算 ―乱択アルゴリズムと確率的解析―

確率と計算 ―乱択アルゴリズムと確率的解析―

作者: Michael Mitzenmacher,Eli Upfal,小柴健史,河内亮周
出版社/メーカー: 共立出版
発売日: 2009/04/24
メディア: 単行本
購入: 2人クリック: 35回
この商品を含むブログ (12件) を見る

Probability and Computing: Randomized Algorithms and Probabilistic Analysis

Probability and Computing: Randomized Algorithms and Probabilistic Analysis

作者: Michael Mitzenmacher,Eli Upfal
出版社/メーカー: Cambridge University Press
発売日: 2005/01/31
メディア: ハードカバー
購入: 3人クリック: 60回
この商品を含むブログ (10件) を見る

アルゴリズムイントロダクション第1巻の付録Cでは数え上げと確率を明瞭、簡潔に解説しています。

アルゴリズムイントロダクション第1巻数学的基礎とデータ構造

アルゴリズムイントロダクション第1巻数学的基礎とデータ構造

作者: T.コルメン,R.リベスト,C.ライザーソン,Thomas H. Cormen,Ronald L. Rivest,Charles E. Leiserso,浅野哲夫,梅尾博司,和田幸一,岩野和生,山下雅史
出版社/メーカー: 近代科学社
発売日: 1995/12
メディア: 単行本
購入: 3人クリック: 144回
この商品を含むブログ (34件) を見る

また、このエントリを記載するにあたり以下のページを参考にしました。