幾何分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

幾何分布(きかぶんぷ、: geometric distribution)は、離散型確率分布の一種である。

[編集] 定義

定数p(ただし0\leq p \leq 1)に対して、正整数を値としてとる確率変数


P(X = k) = p(1-p)^{k-1} \ \ \ (k = 1, 2, 3, \ldots)

という確率を持つとき、確率変数Xはパラメータpの幾何分布に従うという。確率変数Xは、確率pで成功する独立ベルヌーイ試行を繰り返して、初めて成功するまでの試行回数と解釈できる。たとえば、コイントスを続けて最初に表が出るまでに投げた回数、といったものである。

上記の定義より、幾何分布は負の二項分布の特殊なケースであることがわかる。また、期待値\frac{1}{p}分散\frac{1-p}{p^2}となる。

確率変数の範囲が非負整数である場合は、


P(X = k) = p(1-p)^{k} \ \ \ (k = 0, 1, 2, \ldots)

と書くことができ、これも幾何分布と呼ばれる。この場合は、確率変数Xを「コイントスの独立試行で最初に表が出るまでの間に裏の出た回数」と考えればよい。この場合、期待値は明らかに\frac{1-p}{p}となる(分散の値は上記と等しい)。

確率変数の単純な変換によって、前者と後者の定義は等価であることが容易に示される。

[編集] 無記憶性

幾何分布の重要な性質として、無記憶性と呼ばれるものがある。幾何分布では、いかなるパラメータpに対しても


\forall n, k \in \mathbb{N}, \ \ \ P(X > n + k | X > n) = P(X > k)

なる等式が成り立つ。これはコイントスを例にすると、コイントスを繰り返して少なくともn回表が出なかったという情報が与えられたときに、表が出るまでに投げる回数が(n+k)を超える条件付き確率は、情報が与えられない場合の確率(すなわち、今すべてを忘れて改めてコイントスを開始して、表が出るまでに投げる回数がk回を超える確率)に等しいという意味である。

各種のギャンブルにおいて負けが続くと、しばしば「運がたまっている」とか「そろそろ勝ちが巡ってくる」といった考えに陥りがちである。しかし、試行の独立性を仮定する限りにおいては、この考えは誤謬であり、負けが続いているという情報は未来の確率に何の影響も与えないということが、無記憶性からわかる。

この逆、すなわち無記憶性を持つ離散型確率分布が幾何分布のみであることも、比較的容易に示される。

[編集] 関連項目