算術平均
算術平均(さんじゅつへいきん[1]、arithmetic mean)または相加平均(そうかへいきん[2])は数学および統計学において、標本空間の代表値を導出する手法の1つであり、文脈上明らかな場合は単に平均とも呼ぶ。算術平均または相加平均という呼称は主に数学や統計学で使われ、幾何平均や調和平均などの他の平均と区別するためのものである。
数学や統計学だけでなく、経済学、社会学、歴史学などあらゆる学問分野で算術平均が使われている。例えば、国内総生産を人口で割った算術平均からその国民の平均収入を推定することができる。
算術平均は代表値としてよく使われるが、ロバスト統計ではなく、外れ値に大きく影響される。特に歪度の大きい分布では算術平均は通常の「真ん中」の観念と一致しないことがあり、中央値のようなロバスト統計量の方が代表値としてふさわしい場合がある。
定義
標本空間 があるとき、その算術平均 は次のように定義される。
そのリストが母集団そのものなら、これを母平均 (population mean) と呼び、統計標本のリストならこの統計量を標本平均 (sample mean) と呼ぶ。
動機となる属性
算術平均には、代表値として用いるのに適した次のような属性がある。
- という数列の算術平均が X のとき、 が成り立つ。 はその数と平均値との距離であるため、平均値の左にある数と右にある数を釣り合わせていると解釈することもできる。この場合の平均とは、個々の数と平均値との差の総和がゼロになる唯一の数値である。
- という一群の数(測定値など)の概算を1つの数 X で表す必要があるとき、誤差の平方 (xi − X)2 の総和を最小化するという意味で算術平均が最善の選択となる。平均二乗誤差を最小にするという意味でも算術平均が最善の単一推測値となる。
- 正規分布では、算術平均は中央値や最頻値といった代表値と等しい。
問題
算術平均を中央値と同じだと誤解することがあるが、実際には多くの場合異なる。標本空間の標本を大小の順に並べて等差数列となる場合、その算術平均と中央値は等しい。例えば、標本空間 {1,2,3,4} の算術平均は2.5であり、中央値と一致する。しかし {1,2,4,8,16} のように等差数列にならない標本空間では中央値と算術平均は大きく異なる。例の場合の算術平均は6.2だが、中央値は4である。ある標本空間の算術平均を見たとき、その平均値が標本空間の多くの値から大きくかけ離れている可能性を考慮しなければならない。
この現象は経済学などで応用されている。例えば1980年代以降のアメリカ合衆国では、収入の中央値は収入の算術平均より低く、その差は広がり続けている。これは貧富の差が広がっていることを意味する[3]。
角度
位相や角度といった周期的データを扱う場合は、特別な配慮が必要である。1°と359°を単純に算術平均すると180°になってしまうが、これは2つの意味で正しくない。
- 第一に角度の値は360°(ラジアンで計測する場合は 2π)の因数としてのみ定義される。したがって1°と359°を1°と −1°と称することもできるし、1°と719°と称することもでき、それぞれの単純な算術平均は異なる。
- 第二に、この例では0°(または360°)が幾何学的によりよい「平均」であり、その方がばらつきが小さい。
一般にこのようなケースで単純に算術平均を求めると、値の範囲の中央付近に平均値が集まる傾向が生じる。これを防ぐには、ばらつきが最小となるような点を平均とするようにし、円周上の2点の距離の小さい方を2点の距離とするよう再定義する。
脚注・出典
- ^ 金融・経済用語辞典. “算術平均とは”. 2011年4月13日閲覧。
- ^ Yahoo!. “相加平均 - Yahoo!百科事典”. 2011年4月13日閲覧。
- ^ Ben S. Bernanke. “The Level and Distribution of Economic Well-Being”. 2010年7月23日閲覧。
参考文献
- Darrell Huff, How to lie with statistics, Victor Gollancz, 1954 (ISBN 0-393-31072-8).
関連項目
外部リンク
- Calculations and comparisons between arithmetic and geometric mean of two numbers
- Mean or Average
- Weisstein, Eric W. "Arithmetic Mean". mathworld.wolfram.com (英語).