多項分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

多項分布(たこうぶんぷ、: multinomial distribution)は、確率論において二項分布を一般化した確率分布である。

二項分布は、n 個の独立なベルヌーイ試行の「成功」の数の確率分布であり、各試行の「成功」確率は同じである。多項分布では、各試行の結果は固定の有限個(k個)の値をとり、それぞれの値をとる確率は p1, ..., pk(すなわち、i = 1, ..., k について pi ≥ 0 であり、\sum_{i=1}^k p_i = 1 が成り立つ)であり、n 回の独立した試行が行われる。確率変数 X_in回の試行で i という数が出る回数を示す。X=(X_1,\ldots,X_k)np をパラメータとする多項分布に従う。

確率質量関数[編集]

多項分布の確率質量関数は次の通りである。

f(x_1,\ldots,x_k;n,p_1,\ldots,p_k) = \begin{cases}{n! \over x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k} \quad & \mbox{when } \sum_{i=1}^k x_i=n \\
0 & \mbox{otherwise.} \end{cases}

ここで、x_1,\ldots, x_k は負でない整数である。

属性[編集]

期待値は次の通り。

\operatorname{E}(X_i) = n p_i.

共分散行列は次の通りである。対角線上のエントリは二項分布確率変数の分散であるから、次のようになる。

\operatorname{var}(X_i)=np_i(1-p_i).

対角線以外のエントリは共分散であり、次のようになる。

\operatorname{cov}(X_i,X_j)=-np_i p_j

ここで、ij は異なる値である。

共分散は全体として負となる。なぜなら、N が固定であるとき多項ベクトルで1つが増加すると他が減少するためである。

これは、k × k の非負値定符号行列であり、行列の階数k − 1 である。

対応する相関行列の対角線以外のエントリは以下のようになる。

\rho(X_i,X_j) = -\sqrt{\frac{p_i p_j}{ (1-p_i)(1-p_j)}}.

この表現では標本数 n が出現しない点に注意されたい。

k個の要素それぞれは npii番目の要素に対応する確率)をパラメータとする二項分布となる。

多項分布のサポートは集合 \{(n_1,...,n_k)\in \mathbb{N}^{k}| n_1+...+n_k=n\} である。その要素数は {n+k-1 \choose k-1} = \left\langle \begin{matrix}n \\ k \end{matrix}\right\rangle である(重複組合せ)。

関連する分布[編集]

関連項目[編集]

外部リンク[編集]