分散 (確率論)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
不偏分散から転送)
ナビゲーションに移動 検索に移動

分散(ぶんさん、: variance)とは、確率論では、確率変数 X からその期待値 E(X) を引いた2乗の期待値 σ2 = V(X) = E[(XE(X))2] のこと[1]確率変数の2次の中心化モーメントである。確率変数の分布期待値からどれだけ散らばっているかを示す非負の値である[2]

統計学では、記述統計学においては標本標本平均からどれだけ散らばっているかを示す指標として標本分散(ひょうほんぶんさん、: sample variance)を、推測統計学においては不偏分散(ふへんぶんさん、: unbiased variance)・不偏標本分散(ふへんひょうほんぶんさん、: unbiased sample variance)を用いる。0 に近いほど散らばりは小さい。

言葉の由来[編集]

英語の variance(バリアンス)という語はロナルド・フィッシャーが1918年に導入した[3]

確率変数の分散[編集]

2乗可積分確率変数 X の分散は期待値E(·) で表すと

定義される。また式変形をして

とも書ける。また確率変数 X特性関数φX(t) = E(eitX) とおくと(i虚数単位)、これは 2 階連続的微分可能

と表示することもできる。

チェビシェフの不等式から、任意の正の数 ε に対して、

成り立つ。これは分散が小さくなる程に期待値の近くに変数分布することを示す大まかな評価である。

性質[編集]

X, X1, …, Xn確率変数a, b, a1, …, an定数とし、共分散Cov( · , · ) で表すと

  • (非負性)
  • 位置母数英語版に対する不変性)
  • 斉次性

を満たす。したがって、特に X1, …, Xn独立ならば、

より

が成り立つ。

[編集]

母分散[編集]

n 個のデータ x1, x2, ..., xn からなる母集団があって、μ をそのデータの相加平均とした時に、(xiμ)2相加平均

表されσ2母分散(ぼぶんさん、: population variance)と言う[4]標本ではなく母集団に対して適用したときに母分散という。標本と母集団の違いはそれぞれの項目を参照。

標本分散[編集]

n 個のデータ x1, x2, ..., xn からなる標本があって、x をそのデータの相加平均とした時に、(xix)2相加平均

で定義される s2標本分散(ひょうほんぶんさん、: sample variance)と言う。s標準偏差と呼ばれる[4]。なお、不偏標本分散を単に標本分散と呼ぶ文献もある。不偏でないことを強調する場合は偏りのある標本分散: biased sample variance)と言う。日本工業規格では、「各観測値の平均値からの偏差の二乗の和を観測個数から1を引いた数で割ったばらつきの尺度」と定義している[5]

定義より、

となるから、標本分散は、2乗の相加平均相加平均の2乗との差に等しい。従って、このを用いて分散の計算を容易にすることができる。ただし、概して求める分散に対して二乗平均が巨大になるため、浮動小数点数による近似計算を行う場合には大きな丸め誤差が生じる可能性がある(桁落ち)。このため、浮動小数点数を扱う場合には定義に従って偏差の二乗和を計算することが一般的である(あるいは一般の総和計算と同じくカハンの加算アルゴリズムpairwise summation英語版のような手法により、誤差を小さくする工夫が為されることもある)。

不偏分散・不偏標本分散[編集]

偏りのある標本分散は、一般にその期待値母分散よりも若干小さくなる。より正確には、平均と分散を持つ同一分布からの無作為標本に対して

が成り立つ。そこで推定量として

を用いると、期待値が母分散に等しくなる推定量が得られる。 これを母分散の不偏推定量であるとの意味で不偏分散(ふへんぶんさん、: unbiased variance)や不偏標本分散(ふへんひょうほんぶんさん、: unbiased sample variance)と呼ぶ[4]。定義から明らかに、標本数が大きくなるにつれて偏りのある標本分散は不偏標本分散に近づく。

脚注[編集]

参考文献[編集]

  • 栗原伸一『入門統計学検定から多変量解析・実験計画法までオーム社、2011年。ISBN 978-4-274-06855-3
  • 西岡康夫『数学チュートリアル やさしく語る 確率統計オーム社、2013年。
  • 日本数学会『数学辞典』岩波書店、2007年。ISBN 9784000803090
  • JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (1999), http://kikakurui.com/z8/Z8101-1-1999-01.html 
  • 伏見康治確率論及統計論河出書房、1942年。ISBN 9784874720127

関連項目[編集]