コンテンツにスキップ

共分散

出典: フリー百科事典『ウィキペディア(Wikipedia)』

共分散(きょうぶんさん、: covariance)とは、大きさが同じ2つのデータの間での、平均からの偏差の積の平均値である[1]。2 組の確率変数 X, Y の共分散 Cov[X, Y] は、E で期待値を表すことにして、

で定義する。

とも定義できる。

XY の共分散は と表記されることもある。

[編集]

例として、中学生の数学と国語のテストの点数の共分散を考える。まず、山田さんの偏差の積を計算する。

項目数学国語
平均点5050
山田8040
偏差30−10
偏差の積30 × (10) = 300

同様にして、生徒全員について、偏差の積を平均したものが、数学と国語の共分散になる。

数学が平均より高い生徒が、国語も平均より高いテストの点を取っていると、共分散の合計は大きな正の値をとる。逆の関係があれば、大きな負の値をとる。共分散が 0 なら特にそのような関連性はないと考えられる。ちなみにこの関連性は直線的なもの(1次関数)を指している。

共分散は、もとの値の大きさで数値が決まるので、単位が違う変数を複数比較するときなどに解釈が難しい。たとえば市町村単位で、その町ごとの人口と、ラーメン店の売上の共分散を計算しても、数字の意味が分かりにくい。

そこで関係を見る場合にはピアソンの積率相関係数を使うことが一般的である。共分散の値を、各変数(例なら国語と数学)の標準偏差の積で割ったものが相関係数となる。相関係数は 1 から 1 までの値をとる。1 であれば 2 つの変数の値は完全に同期していることになる。対象によってかなり相関係数の意味は変わってくるが、一例としてはアンケートでは以下の表のような見方もある。

相関係数の範囲評価
1〜0.7強い負の相関
0.7〜0.4かなりの負の相関
0.4〜0.2やや負の相関
0.2〜0.2ほとんど相関なし
0.2〜0.4やや正の相関
0.4〜0.7かなりの正の相関
0.7〜1強い正の相関

脚注

[編集]
  1. 西岡 2013, p. 24, 確率統計, 2.3 共分散.

参考文献

[編集]
  • 西岡康夫『数学チュートリアル やさしく語る 確率統計』オーム社、2013年。ISBN 9784274214073 
  • 佐和隆光『初等統計解析 改訂版』新曜社、1985年。ISBN 9784788502246 

関連項目

[編集]