平均(へいきん)とは、観測されるデータから、その散らばり具合を“平らに均(なら)して”得られる、統計的な指標である。平均値ともいう。
例えば A, B, C 三人の体重がそれぞれ 55 kg, 60 kg, 80 kg であったとすると、合計は 195 kg であり、これは 65 kg の人が三人いた場合と同じである。
このようなとき、A, B, C の体重の平均は 65 kg であるといわれる。
これは相加平均(後述)の一例であるが、特に断らずに平均という場合の多くは相加平均を指している。母集団ではなく標本から計算しているという意味で、標本平均と呼ぶこともある。
相加平均
最も基本的な平均は相加平均(そうかへいきん)である。算術平均(さんじゅつへいきん 英語: arithmetic mean)とも呼ぶ。単に平均といった場合はこれを意味する。
相加平均は
と定義される。あるいは
とも表せる。
の相加平均は とも表される。
相加平均は、任意の実数、さらには任意の複素数に対し定義できる。
一般化平均
相乗平均
相乗平均(そうじょうへいきん)または幾何平均(きかへいきん、英: geometric mean)を
と定義する。相乗平均は相加平均、幾何平均は算術平均に対する用語である。
あるいは
とも表せる。
対数を取ると
となり、相乗平均は、対数の算術平均の指数関数である。あるいは、相乗平均の対数は対数の算術平均である。
相乗平均は、全てのデータが非負のときのみ定義できる。データに1つ以上の0があるときは、相乗平均は0となる。データに偶数個の負数がある場合、定義式は正の値を相乗平均として返すが、この値に意味はない。
調和平均
調和平均(ちょうわへいきん、英: harmonic mean)を、
と定義する。あるいは
とも表せる。
調和平均は、逆数の算術平均の逆数である。あるいは、逆数の算術平均は調和平均の逆数である。
しかし、
データに1つ以上の0があるとき、調和平均の定義式はそのままでは使えないが、0への極限を取ると、調和平均は0となる( のとき )。データに負数があっても調和平均は計算することができる。ただし、正負が混在している場合に逆数の和が0になることがあり、その場合の極限は発散する。
一般化平均
算術平均、相乗平均、調和平均は同じ式
あるいは
で表せる。この式を一般の実数 m に対し定義した値を一般化平均と呼ぶ。
m = 1 で算術平均、m = -1 で調和平均となり、m → 0 への極限が相乗平均である。これらのほか、m = 2 の場合を二乗平均平方根 (RMS) と呼び、物理学や工学で様々な応用をもつ。m → ∞ への極限は最大値、m → -∞ への極限は最小値である。
一般化平均は、ベクトル の m-ノルムを で割った結果に一致する。
データの m 乗の平均、つまり、一般化平均の m 乗
を m 乗平均と呼ぶ。
m 乗平均・一般化平均の応用として、例えば統計学では分散と標準偏差がある。それぞれ m = 2 の場合の m 乗平均・一般化平均により定義されている。(ただし、相加平均を引いた後 m 乗平均・一般化平均を取る)。
一般化平均はさらに一般化が可能で、全単射な関数 f により
という平均が定義できる。恒等関数 f(x)= x により相加平均が、逆数 f(x)= 1/x により調和平均が、対数関数 f(x)= log x により相乗平均がそれぞれ表されている。
定義域
一般の実数 m による一般化平均は、全てが非負の実数であるデータに対してのみ定義される。これは、一般化平均の式に現れる m 乗根(冪関数)が負数に対し定義できないためである。例外は、冪関数を使わずに計算できる算術平均と調和平均 (m = ±1) である。m ≠ ±1 の場合、1つ以上の負数が含まれるデータに対し、一般化平均の定義式は実数を返さないか、実数を返したとしても結果は解釈が難しい。
m < 0 の場合、1つ以上の0が含まれるデータに対し一般化平均の定義式は使えないが、調和平均同様、0への極限を取ると一般化平均は0となる。幾何平均(m = 0 の一般化平均)も0となるので、m ≦ 0 の場合に一般化平均は0となる。
具体例
- 相乗平均
- 78年の経済成長率 20% 79年の経済成長率80%の場合,この2年間の平均成長率はより、約47%
- 調和平均
- 往は時速60km 復は時速90kmの場合の往復の平均速度は である。
- 並列接続された電気抵抗の抵抗値などを考える場合に用いる(直列回路と並列回路)。
関係式
相加平均≧相乗平均≧調和平均
n 個のデータが全て正の時、次のような大小関係が成り立つ。
相加平均 ≥ 相乗平均 ≥ 調和平均
等号成立のための必要十分条件は、
である。
左側の不等式は、「対数を使った関係式」にlogの凸性(ジェンセンの不等式)を適用すれば証明できる(数学的帰納法を使った別証明も知られている)。
右側の不等式は、調和平均が逆数の相加平均の逆数という事実を左側の不等式に適用すれば証明できる。
相加平均と調和平均の相乗平均
データ数nが2のときの相加平均、相乗平均、調和平均をそれぞれA、G、Hとすると、
なので、
が成立する。すなわち、もとのデータの相乗平均は相加平均と調和平均の相乗平均に等しくなる。
様々な平均
加重平均
観測される値それぞれに重みがある時には、単に相加平均をとるのでなく重みを考慮した平均をとるのが便利である。各データ xi に、重み wi がついているときの加重平均(重み付き平均)は
と定義される。全ての重みが等しければ、これは通常の相加平均である。
相乗平均についての重み付き平均は
と定義される。ただし、 とする。
連続分布の相加平均
観測されるデータ x(t) が区間 [a, b] 上に連続的に分布しているとき、その相加平均は積分
と定義される。これは離散分布の相加平均に対して、無限個の平均を算出する操作を極限により表したものである。
ベクトルの平均
ベクトルに対し、
の(相加)平均を、
により定義する。
相加平均と違い、相乗平均や調和平均はベクトルの場合に一般化できない。
ベクトルの数が3の場合、の平均は、
の作る三角形の重心に一致する。
ベクトルの数が4の場合も同様で、の平均は、
の作る四面体の重心に一致する。
この事実は一般にベクトルの数が n の場合も拡張でき、の平均は、
の作るn-単体の重心に一致する。
また、後述するように、ベクトルの平均は物理学における質点の重心と関係がある。
加重平均も同様にベクトルに拡張でき、
と定義される。
m 乗平均・一般化平均はスカラー
として定義される。ただしここでは、ベクトルのノルムである。
m = 2 の場合、 は内積 に一致するので、m = 2 の場合の m 乗平均や一般化平均が特に重要である。たとえば物理学では速さの平均値として、m = 2 の場合の一般化平均を使うことがある。
ベクトルの加重平均の概念には、物理的な解釈を与える事ができる。質点 がそれぞれ位置 にあり、それぞれの質量が であるとき、 の重心は、加重平均
に一致する。
よって特にベクトルの(相加)平均は、質量1の質点達の重心に一致する。
算術幾何平均
を、 を満たす2つの非負実数とする。
を
により定義する。
このとき、
を と の算術幾何平均という。
平均を用いる際の注意
調査では、平均は代表値としてしばしば使われる。ただし、それが調査の目的に適切かどうかは検討を必要とする。例を挙げる。
世帯の貯蓄の事例では、一部の大金持ちの巨大な貯蓄が平均値を引き上げてしまうため、最も多い数の貯蓄額が仮に300万円だとしても平均は700万円くらいになる。従って、一般的な世帯の貯蓄について考察するのが目的ならば中央値や最頻値を用いるべきである。より一般に、このように分布が左右対称でない際は平均値以外の使用も考えるべきである。
関連項目