中心極限定理

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索
サイコロを n 個振ったときに出る目の和 Sn = X1 + … + Xn の分布が n を大きくするに従って正規分布による近似に近づく様子

中心極限定理(ちゅうしんきょくげんていり、: central limit theorem)は、確率論統計学における極限定理の一つ。

大数の法則によると、ある母集団から無作為抽出された標本平均はサンプルのサイズを大きくすると真の平均に近づく。これに対し中心極限定理標本平均と真の平均との誤差を論ずるものである。多くの場合、母集団の分布がどんな分布であっても、その誤差はサンプルのサイズを大きくしたとき近似的に正規分布に従う。

なお、標本の分布分散が存在しないときには、極限が正規分布と異なる場合もある。

統計学における基本定理であり、例えば世論調査における必要サンプルのサイズの算出等に用いられる。

定理[ソースを編集]

以下の定理はLindeberg (1922)による[1]

期待値 μ と分散 σ2 を持つ独立同分布 ("i.i.d.") に従う確率変数 ("r.v.") 列 X1, X2, ... に対し、

とおくと、

つまり、i.i.d. r.v. 列の和を標準化すると、期待値 0, 分散 1 の正規分布 N(0, 1) に分布収束する。

従って、n が十分大きいとき近似的に、標本平均 と真の平均 μ との誤差 をルートn倍したものは,平均 0, 分散 σ2 の正規分布 N(0, σ2) に従う。

証明[ソースを編集]

中心極限定理は特性関数を用いることにより証明できる。 {X1, …, Xn}を独立で同等な分布の確立変数とする。この分布の平均をµ、分散をσ2とする。 ここで和 X1 + … + Xnを考えると、平均と分散はそれぞれ、2となる。ここで確率変数

を考える。最後の式では、平均0、分散1の新しい確率変数Yi = Xiμ/σを定義した。 ここで、Zn特性関数

最後の等式は全てのYiが同等であることから導いた。ここで、テイラー展開を考える。以下の等式に留意すると

t=0の近傍のテイラー展開(マクローリン展開)は

となる。ここで c は定数であり、o表記であり、 よりも早く0に収束する関数を表す。 この式と指数関数の定義

を用いると、における極限が以下のように求められる。

最後の関数は標準正規分布N(0,1)の特性関数である。特性関数と確率分布の対応は一対一なので、この結果は の極限で N(0,1)に収束することを意味する。なお、厳密に特性関数の収束と確立分布関数の収束の対応関係が成り立つことはレヴィの連続性定理英語版により保証される。 以上により、和X1 + … + Xnは正規分布N(,2)に収束し、 標本平均

は正規分布 N(µ,σ2/n)に収束することが証明された。

正規分布に収束しないケース[ソースを編集]

より一般化された確率理論(コルモゴロフの公理)では、中心極限定理は弱収束理論 (weak-convergence theories) の一部となる。それによると、独立で同一の確率分布(i.i.d.)にしたがう確率変数の分散(2次の中心モーメント)が有限な場合は「確率変数の和の確率分布」は変数の数が多くなるにしたがい正規分布に収束する(古典的な中心極限定理が成り立つ)が、確率変数がしたがう分布の裾が |x|−α−1 ( ただし、0 < α < 2)のべき乗で減衰する場合(分布の裾が厚くなり分散は無限大に発散して)(正規分布には収束せず)特性指数α安定分布に収束する。[2]

※なお安定分布は特性指数が 0 < α < 2 のとき分散は無限大となり、分布の裾が冪乗則にしたがうファットテールを有する。

脚注[ソースを編集]

  1. ^ Feller 1968, p. 244.
  2. ^ Voit, Johannes (2003). The Statistical Mechanics of Financial Markets. Springer-Verlag. p. 124. ISBN 3-540-00978-7. 

参考文献[ソースを編集]

  • Feller, William (1968). An introduction to probability theory and its applications. I (Third ed.). John Wiley & Sons, Inc.. ISBN 0-471-25711-7. 

関連項目[ソースを編集]