外れ値

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

外れ値(はずれち)は、統計において他の値から大きく外れた値である。

測定ミス・記録ミス等に起因する異常値とは概念的には異なるが、実用上は区別できないこともある。

検定[編集]

外れ値かどうか検定したい標本について、偏差を不偏標準偏差で割った検定統計量

 \tau_1 = \frac{ x_1 - \mu } \sigma

を求め(x1 は標本値、μ平均σ は標準偏差)、この値(両側検定をする場合はこの絶対値)が有意点より大きいかどうかで検定する。

簡単な方法では、2または3を有意点とする。つまり、μ ± 2–3 σ の外なら外れ値とする。

スミルノフ・グラブス検定[編集]

より精密には、正規分布を仮定して、スミルノフ・グラブス (Smirnov‐Grubbs) 検定を使う。標本数を n、所要の有意水準α自由度 n - 2 のt分布α / n × 100 パーセンタイルt として、

 \tau = \frac{ (n - 1) t }{ \sqrt{ n(n - 2) + n t ^ 2 } }

を有意点とする。この式は再帰的に使う。つまり、最も外れた1標本のみを検定し、それが外れ値と判定されたら、それを除外した n - 1 個の標本を使って2番目に外れた標本を検定し、以下、外れ値が検出されなくなるまで繰り返す。

トンプソン検定[編集]

トンプソン (Thompson) 検定では、

t = \frac{ \tau \sqrt{n - 2} }{ \sqrt{ n - 1 - \tau ^ 2 } }

を使う。計算式の都合上、スミルノフ・グラブス検定とは逆に、標本値の検定統計量 τ1 から t1 を経て有意水準 α1 を求めることが多い。n が十分大きければスミルノフ・グラブス検定と同じ結果になる。

外部リンク[編集]