超幾何分布
- 今、2種類のものがあり、併せてN個である。M個と(N-M)個に分かれているとする。今、Nの値もMの値も不明だとする。このN個から、n個を取り出してやったら、2種類はn1個とn2個であることがわかるだろう。これを繰り返すことによって、の値の推定が可能で、実は、この推定値がとなっている。n1=xになる確率がで、これをについて足し合わせると総和が1になるような確率分布であることが式変形などで示すことができ、このような確率分布を超幾何分布と言う。この超幾何分布の期待値は確率分布の式変形から求めたものと一致する。この超幾何分布が仮定しているサンプリングは、有限個(N)からn個を取り出す(取り出した後には、N-n個残る)ようなサンプリングである。このようなサンプリングは、2項分布のときのサンプリングと異なることに留意する。2項分布においては、n回の試行のそれぞれである事象の起きる確率を一様にPとしたが、こちらのサンプリングでは、取り出すたびにある事象の起きる確率は変化している(その確率の変化自体は式に登場しないが)。2項分布的なサンプリングと超幾何分布的なサンプリングである事象が観測される期待値は同じであるが、両者の違いは分散の違いとなって反映されている。ちなみに2項分布の場合の分散はであるのに対し、超幾何分布のそれはとなる
ポアソン分布
- ポアソン分布は2項分布の生起確率Pをゼロに限りなく近づけたものに相当している
- 2項分布は、ある事象が起きる確率Pと起きない確率1-Pであるときに、総計N回の観測で、k回起きる確率を与える分布である
- この式では、N回試行してk回起きる確率が求められている。言い換えると試行回数を指定して、起きる回数も指定することでその確率が求められている
- ポアソン分布は2項分布の極限
- 今、Pが非常に小さい事象を考える。非常に小さいのでこれくらい(たとえば1万回に1回くらい)なことはわかっているが、実際に何回試行するかは未定だとする。そのような場合にも、極限をとることで、事象がk回起きる確率が計算できる。それは、生起確率が非常に小さいので、実際にN回試行するとしようとN'回試行すると仮定しようと、回試行すると仮定した場合とみなせるような状況だから、である(多分。)
- 実際に2項分布の極限をとってみる
- 非常に小さい生起確率とすると、n回の試行においてk回起きる確率は
- 今、とするとと式変形できて、これは、k回起きる確率が(1万回に1回くらい稀な事象、というときのとkのみによって決まることがわかる
- 非常に小さい生起確率とすると、n回の試行においてk回起きる確率は