ポアソン二項分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索
ポアソン二項分布
確率質量関数
累積分布関数
母数 \mathbf{p}\in [0,1]^n - n 回試行のそれぞれに対する成功確率
 k \in \{0, \ldots, n \}
確率質量関数 \sum\limits_{A\in F_k} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c} (1-p_j)
累積分布関数 \sum\limits_{l=0}^k \sum\limits_{A\in F_l} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c}{(1-p_j)}
期待値 \sum\limits_{i=1}^n p_i
分散  \sigma^2 =\sum\limits_{i=1}^n (1 - {p_i}){p_i}
歪度 \frac{1}{\sigma^3}\sum\limits_{i=1}^n {\left( 1-2{p_i} \right)\left( 1-{{p}_{i}} \right){{p}_{i}}}
尖度 \frac{1}{\sigma^4}\sum\limits_{i=1}^n {\left( 1 - 6(1 - p_i){p_i} \right)\left( 1 - p_i \right)p_i}
モーメント母関数 \prod\limits_{i=1}^n (1-{p_i}+{p_i}{e^{t}})
特性関数 = \prod\limits_{i=1}^n (1-{p_i}+{p_i}{e^{it}})
テンプレートを表示

統計学および確率論においてポアソン二項分布(Poisson binomial distribution)とは、独立ベルヌーイ試行の和として定義される離散確率分布である。

別の言い方をすれば、これは成功確率がそれぞれp_1, p_2, \dots , p_nであるようなそれぞれ独立なn回の試行を行ったときの成功回数の離散確率分布である。

ここで、すべての成功確率が同じ値p_1 = p_2 = \dots = p_nとすると、ポアソン二項分布は普通の二項分布になる。すなわち二項分布はポアソン二項分布の特別な場合である。

確率質量関数[編集]

n個の確率変数X_i,i \in \{1,2,\ldots,n\}は、それぞれ独立で成功確率がそれぞれp_1, p_2, \dots , p_nであるようなベルヌーイ試行とする。すなわち、

X_i \in \{1,0\} ,\qquad P(X_i=1)=p_i , \qquad P(X_i=0)=1-p_i

とする。確率変数X= \sum_{i=1}^n X_iは、このようなn回の試行のうちで成功した回数をあらわす確率変数である。k回成功する確率は次のような和で表現される[1]

Pr(X=k) = \sum\limits_{A\in {{F}_{k}}}{\prod\limits_{i\in A}{{{p}_{i}}}\prod\limits_{j\in {{A}^{c}}}{(1-{{p}_{j}})}}

ただし、\ F_k\ \{1,2,3, \ldots, n \}から選べるすべてのk要素部分集合の族である。例えばn= 3なら、{F_2}=\left\{ \{1,2\},\{1,3\},\{2,3\} \right\}である。また\ A^c\ \ A\ の補集合。すなわちA^c =\{1,2,3,\dots,n\}\backslash Aである。

これが、定義から直接導かれるポアソン二項分布の確率質量関数である。\ F_k\ \ n!/(n-k)!k!\ 要素を含み、この数はnとともに急速に増大するため、試行回数nが小さい場合以外は実際にこの和を計算することは困難である。(例えば\ n=30\ のとき\ F_{15}\ \ 10^{20}\ もの要素を含む)。 幸いにも、\ Pr(X=k)\ を計算する非常に効果的な方法がある。一回も成功しない確率が分かれば、n回成功の確率は次のようにして再帰的に計算できる[2]

\Pr (X=k)=\left\{ \begin{align}
  & \prod\limits_{i=1}^{n}{(1-{{p}_{i}})}, \qquad k=0 \\ 
 & \frac{1}{k}\sum\limits_{i=1}^{k}{{{(-1)}^{i-1}}\Pr (X=k-i)T(i)}, \qquad k>0 \\ 
\end{align} \right.

ただし、T(i)=\sum\limits_{j=1}^{n}{{{\left( \frac{{{p}_{j}}}{1-{{p}_{j}}} \right)}^{i}}}.

他にも離散フーリエ変換を使う次のような計算も可能である[3]

\Pr (X=k)=\frac{1}{n+1}\sum\limits_{l=0}^{n}{{{C}^{lk}}\prod\limits_{m=1}^{n}{\left( 1+({{C}^{l}}-1){{p}_{m}} \right)}}

ただし、C=\exp \left( -\frac{2i\pi }{n+1} \right)である。

さらに他の方法も提案されている[4]


平均と分散[編集]

ポアソン二項分布は独立なベルヌーイ分布に従うn個の確率変数の和だから、その平均と分散は各ベルヌーイ分布における平均および分散の和となる。

\mu = \sum\limits_{i=1}^n p_i
\sigma^2 =\sum\limits_{i=1}^n (1-p_i) p_i


レ・カムの定理[編集]

次の定理がルーシェン・レ・カム(Lucien le Cam)によって示された[5][6]

次のように仮定する

  • X_1,\ldots,X_nはそれぞれベルヌーイ分布に従う独立な確率変数とする。(すなわち0か1の値をとる)ただしそれぞれが同一の分布である必要はない。(発生確率がそれぞれ異なっていてもよい) 各 X_i,\ i = 1, 2, 3, \ldots, nに対して、\ Pr(X_i= 1) = p_i\ とする。
  • \lambda_n = p_1 + \cdots + p_n.\,
  • S_n = X_1 + \cdots + X_n.\, (すなわち\ S_n\ はポアソン二項分布に従う。)

このとき、

\sum_{k=0}^\infty \left| \Pr(S_n=k) - {\lambda_n^k e^{-\lambda_n} \over k!} \right| < 2 \sum_{i=1}^n p_i^2.

換言すれば、この和はポアソン分布で近似できる。

各分布がすべて同じ値\ p_i = {\lambda_n}/{n} \ とすれば、右辺は 2{\lambda_n^2}/{n} となる。すなわち、この定理は、二項分布の極限がポアソン分布になるというポアソンの極限定理の一般化である。

関連項目[編集]

参考文献[編集]

  1. ^ Wang, Y. H. (1993), “On the number of successes in independent trials” (PDF), Statistica Sinica 3 (2): 295-312, http://www3.stat.sinica.edu.tw/statistica/oldpdf/A3n23.pdf 2010年2月20日閲覧。 
  2. ^ Chen, X. H; A. P Dempster, J. S Liu (1994), “Weighted finite population sampling to maximize entropy”, Biometrika 81 (3): 457-469, http://www.people.fas.harvard.edu/~junliu/TechRept/94folder/cdl94.pdf 2010年2月20日閲覧。 
  3. ^ Fernandez, M.; S. Williams (2010), “Closed-Form Expression for the Poisson-Binomial Probability Density Function”, IEEE Transactions on Aerospace Electronic Systems 46: 803-817, doi:10.1109/TAES.2010.5461658 
  4. ^ Chen, S. X; J. S Liu (1997), “Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions”, Statistica Sinica 7: 875-892, http://www3.stat.sinica.edu.tw/statistica/password.asp?vol=7&num=4&art=4 2010年2月20日閲覧。 
  5. ^ Le Cam, L. (1960), “An Approximation Theorem for the Poisson Binomial Distribution” (PDF), Pacific Journal of Mathematics 10 (4): 1181-1197, MR:0142174. Zbl 0118.33601, http://projecteuclid.org/euclid.pjm/1103038058 2010年2月20日閲覧。 
  6. ^ Le Cam, L. (1963), Jerzy Neyman; Lucien le Cam, eds., On the Distribution of Sums of Independent Random Variables, New York: Springer-Verlag, pp. 179-202, MR:0199871