カイ二乗分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索
カイ二分布
確率密度関数
Probability density plots of gamma distributions
累積分布関数
Cumulative distribution plots of gamma distributions
母数 k \in \{1,2,\cdots \} =\mathbb{Z}_{+} \,
x\in [0, \infty)
確率密度関数  \frac{x^{k/2-1}e^{-x/2}}{\,2^{k/2} \Gamma(k/2)}
累積分布関数 \frac{\gamma(k/2, x/2)}{\Gamma(k/2)}
期待値 k  \,
中央値 \simeq k-\frac{2}{3}+\frac{4}{27k}-\frac{8}{729k^2}
最頻値

0\text{ for }k < 2 \,

k-2 \text{ for }k \geq 2
分散 2k\,
歪度 \frac{2\sqrt{2}}{\sqrt{k}}
尖度 \frac{12}{k}
エントロピー

k/2 +\ln2+ \ln\Gamma(k/2) \!

+ (1-k/2 ) \psi(k/2) \,
モーメント母関数 \frac{1}{(1 - 2t)^{k/2}}\text{ for }t < 1/2
特性関数 \frac{1}{(1 - 2i  t)^{k/2}}
テンプレートを表示

カイ二乗分布(カイにじょうぶんぷ、カイじじょうぶんぷ)、または\chi ^2分布確率分布の一種で、推計統計学で最も広く利用されるものである。ヘルメルトにより発見され[1]ピアソンにより命名された[2]

X_i を、平均\mu_i分散\sigma_i^2正規分布に従う、k 個の独立なランダム変数とすると、統計量

Z = \sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2

はカイ二乗分布に従う。普通はこれを

Z\sim\chi^2_k

と書く。カイ二乗分布はk という1個の母数をもつ。これはX_i自由度に等しい正の整数である(場合によっては非整数自由度のカイ二乗分布も用いられる)。カイ二乗分布はガンマ分布の特殊な場合に当たる。

カイ二乗分布はカイ二乗検定と総称される多くの検定法のほか、フリードマン検定などにも利用される。

目次

性質[編集]

カイ二乗分布の確率密度関数は

x \ge 0 に対し

f(x;k)=\frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}

またx \le 0 に対しf_k(x) = 0 という形をとる。ここで \Gammaガンマ関数である。

累積分布関数は

F(x;k)=\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}\

(ただし\gamma(k,z)不完全ガンマ関数)である。

Y = (X_1 / \nu_1)/(X_2 / \nu_2) (ただし X_1 \sim \chi_{\nu_1}^2X_2 \sim \chi_{\nu_2}^2 はカイ二乗分布に従う独立なランダム変数)とすると、Y \sim \mathrm{F}(\nu_1, \nu_2) 、つまり自由度で割って比をとるとF分布に従う。

X \sim \chi_2^2 (自由度2)ならば、X は期待値2の指数分布に従う。

自由度 k のカイ二乗分布に従うランダム変数の期待値k で、分散2k である。中央値は近似的に

k-\frac{2}{3}+\frac{4}{27k}-\frac{8}{729k^2}

となる。

カイ二乗分布は再生性を持つ。すなわち、X \sim \chi_m^2, \ Y \sim \chi_n^2ならば、X + Y \sim \chi_{m+n}^2となる。

正規分布による近似[編集]

X\sim\chi^2_k として、k が無限大に近づくとX の分布は正規分布に近づくが、近づき方はゆっくりしている (歪度\sqrt{8/k}尖度12/k )ため、X自体より速く正規分布に近づく次の2つの方法が普通用いられる。

  • \sqrt{2X} は近似的に平均 \sqrt{2k-1} 、分散1の正規分布に従う(R.A.フィッシャー)。
  • \sqrt[3]{X/k} は近似的に平均 1-2/(9k) 、分散 2/(9k)の正規分布に従う(ウィルソンとヒルファティ、1931年)。

脚注[編集]

  1. ^ Helmert, F. R. (1875): Ueber die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler, Zeitschrift für Mathematik und Physik, 20, 300-303[1]
  2. ^ Pearson, K. (1900): On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling, Philosophical Magazine 5, 50, 157-175

関連項目[編集]