分散
分散(ぶんさん、variance)は、確率論において、確率変数の2次の中心化モーメントの事で、確率変数の分布が期待値からどれだけ散らばっているかを示す値。統計学においては、確率変数の分散だけでなく、標本が標本平均からどれだけ散らばっているかを示す指標として標本分散が用いられる。
目次 |
確率変数の分散 [編集]
とも書ける。
チェビシェフの不等式から、任意の正数
に対して、
が成り立つが、これは分散が小さくなる程に期待値の近くに変数が分布している事を示す大まかな評価である。
性質 [編集]
- X と Y が独立な場合、
となる。
母分散 [編集]
個のデータ
,
, …,
,
からなる母集団があって、
をそのデータの相加平均とした時に、
の相加平均
で表される
を母分散と言う。
標本分散 [編集]
個のデータ
,
, …,
,
からなる標本があって、
をそのデータの相加平均とした時に、
の相加平均
で定義される
を標本分散 (sample variance) と言う(
は標準偏差と呼ばれる)。なお、後述の不偏分散を標本分散と呼ぶ文献もある。
定義より、
となるから、標本分散は、理論的には2乗の相加平均から相加平均の2乗を引いた値に等しい。従って、手計算等ではこの式に依る分散の計算が簡便で好い。 しかし、有限桁しか扱えないコンピュータでこの式による標本分散を計算すると、桁落ちによる誤差が発生して正しく計算できない恐れがあるので、定義の式で計算する事が望ましい。
不偏分散 [編集]
上記の標本分散は、標本抽出の方法が非復元抽出かつ母集団の大きさと標本数が一致する場合を除いて、その期待値が母分散(母集団の分散)よりも若干小さくなる事が知られている。そこで、復元抽出で標本を抽出した場合もしくは非復元抽出で標本数が十分に大きい場合(数学的には標本数が無限大)には期待値が母分散に等しくなるように補正を掛けた
が用いられる事も多く、これを母分散の不偏推定量であるとの意味で不偏分散 (unbiased variance) と呼ぶ。定義式より明らかなように、標本数が十分多ければ、不偏分散と標本分散の値は殆ど等しい。
の分散は
で表す









