正規分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』

正規分布
確率密度関数
正規分布の確率密度関数
緑は標準正規分布
分布関数
正規分布の分布関数
色は確率密度関数と同じ
母数 μ 位置(実数)
σ2 > 0 スケールの2乗 (実数)
x \in (-\infty,+\infty)\!
確率密度関数 \frac1{\sigma\sqrt{2\pi}}\; \exp\left(-\frac{\left(x-\mu\right)^2}{2\sigma^2} \right) \!
分布関数 \frac12 \left(1 + \mathrm{erf}\,\frac{x-\mu}{\sigma\sqrt2}\right) \!
期待値 μ
中央値 μ
最頻値 μ
分散 σ2
歪度 0
尖度 0または3
エントロピー \ln\left(\sigma\sqrt{2\,\pi\,e}\right)\!
モーメント母関数 M_X(t)= \exp\left(\mu\,t+\frac{\sigma^2 t^2}{2}\right)
特性関数 \phi_X(t)=\exp\left(\mu\,i\,t-\frac{\sigma^2 t^2}{2}\right)
  

正規分布せいきぶんぷ、 Normal Distribution)は、ド・モアブル二項分布の近似として発見した確率分布である。 その後、ラプラスルジャンドル等の誤差最小二乗法に関する研究を経て、ガウスの誤差論で詳細に論じられた。 ガウス分布(Gaussian Distribution)とも呼ばれる。

目次

[編集] 概要

次の式で表される確率密度関数を持つ。

f(x)=\frac{1}{\sqrt{2\pi}\sigma} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2} \right)

ここで、μ は平均、σ2分散。この正規分布を N(μ, σ2) と表す。 特に μ=0, σ2=1 の時、この分布は標準正規分布と呼ばれる。標準正規分布を表す式は、簡単に

f(x)=\frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2} \right)

と書ける。

正規分布の確率密度関数をグラフ化した正規分布曲線は左右対称なつりがね状の曲線であり、の形に似ている事からベル・カーブとも呼ばれる。直線x = μを軸に左右対称であり、x軸が漸近線である。なお、曲線はσの値が大きいほど扁平になる。

なお、中心極限定理により、巨大な n に対する二項分布とも考える事が出来る。

平均値の周辺のモーメント

E(X-\mu)^n = \begin{cases}
0, & \mbox{if }n\mbox{ is odd} \\
1 \times 3 \times \cdots \times (n-1)\sigma^n, & \mbox{if }n\mbox{ is even} 
\end{cases}

となる事が知られている。

又、多変量の統計として共分散まで込めた多次元の正規分布も定義され、平均 μ = (μ1, μ2, ..., μm) の m 次元正規分布の同時密度関数は次の式で与えられる。

\frac{1}{(\sqrt{2\pi})^m \sqrt{|S|}}\exp\left(-\frac{1}{2}S^{-1}[\mathbf{x}-\boldsymbol{\mu}]\right)

ここで、S = (σij) は分散共分散行列と呼ばれる正値対称行列で、記号 A[x] は二次形式 xTAx である。 この多次元分布を N(μ, S) と表す。なお、Nは「正規分布」を表す英語 "Normal Distribution" の頭文字である。

自然界の事象の中には、正規分布に従う数量の分布をとるものがある事が知られている。又、そのままでは変数が正規分布に従わない場合も、その対数をとると正規分布に従う場合がある。

[編集] 使用記号の意味

  • N(μ, σ2 )

Nは「正規分布」を表す英語 "Normal Distribution" の頭文字である。 μ は平均、σ2分散。この正規分布を N(μ, σ2) と表す。

[編集] 統計的な意味

確率変数XN( μ, σ2)に従う時、平均 μ からのずれが\pm 1\sigma以下の範囲にXが含まれる確率は68.26%、\pm 2\sigma以下だと95.44%、さらに\pm 3\sigmaだと99.74%となる。

正規分布は、t分布F分布といった種々の分布の考え方の基礎になっているだけでなく、実際の統計的推測においても、仮説検定区間推定など、様々な場面で利用される。

なお、実際に検定などにおいて正規分布を用いる時は、確率変数x標準化した変数z=\frac{x-\mu}{\sigma}が標準正規分布に従う事を利用する場合がほとんどである。

不連続値をとる確率変数についての検定の場合でも、連続変数と同様の考え方で正規分布を近似的に用いる事がある。これは変数の個数が大きいほど、あるいはデータの階級幅が狭いほど、信頼できるものとなる。

確率密度関数から実際に値を求める場合は少なく、標準正規分布表とよばれる、変量に対応した確率をあらわす一覧表から値を算出する場合がほとんどである。

[編集] 正規分布の適用

前述のごとく"自然界"の事象(無機的なそれ)の中には、正規分布に従う数量の分布をとるものがある事が知られている。しかしそれは"多数派"という訳ではない。19世紀ではさながら正規分布万能主義といったものがまかり通っていたが、20世紀以降そういった考え方に修正が見られた。社会現象、生物集団の現象等々、種別から言えば、正規分布に従うものは少数派であることが確認されている。

何らかの事象について法則性を捜したり理論を構築しようとしたりする際、その確率分布がまだ分かっていない場合にはそれが正規分布であると仮定して推論する事は珍しくないが、誤った結論にたどりついてしまう可能性がある。

本当にその事象が正規分布であるかどうかは実際のデータから確認するしかない。

[編集] 関連項目