t検定

出典: フリー百科事典『ウィキペディア(Wikipedia)』


t検定(ティーけんてい)とは、帰無仮説が正しいと仮定した場合に、統計量がt分布に従うことを利用する統計学検定法の総称である。母集団正規分布に従うと仮定するパラメトリック検定法であり、t分布が直接もとの平均標準偏差にはよらない(ただし自由度による)ことを利用している。2組の標本について平均に有意差があるかどうかの検定などに用いられる。

スチューデントのt検定とも呼ばれるが、これは統計学者のウィリアム・ゴセットStudent というペンネームで最初の論文を発表した(1908年)ためである。

目次

[編集] 種類

t検定は大きく次のように分けられる。

  • 2つの母集団がいずれも正規分布に従うと仮定した上での、平均が等しいかどうかの検定。
    • 標本が対になっている、つまり1組の標本のメンバー各々ともう1組の特定のメンバーとの間に特別な関係がある場合(たとえば、同じ人に前後2回調査する場合、夫と妻とで比較する場合など)。
    • 標本が独立で、比較する2つの群の分散が等しいと仮定できる場合(等分散性の仮定)。
    • 標本が独立で、等分散性が仮定できない(異分散)場合。これは正確にはウェルチのt検定と呼ばれる。
  • 正規分布に従う母集団の平均が、特定の値に等しいかどうかの検定。
  • 回帰直線勾配が0と有意に異なるかどうかの検定。

[編集] 方法

[編集] 前段階

t検定を行う前段階として、標本に関して次のような検定が必要な場合もある。

[編集] 平均の検定:等分散の場合

比較する両群をX1, ..., XmおよびY1, ..., Yn(標本サイズはmおよびn)とする。両群から標本平均\overline{X}および\overline{Y}、ならびに不偏分散UxおよびUyを求める。 両群を合わせた分散の推定値Ue

U_e=\frac{(m-1)U_x+(n-1)U_y}{m+n-2}

により算出する。

これから検定統計量t0

t_0=\frac{|\overline{X}-\overline{Y}|}{\sqrt{U_e\left(\frac{1}{m}+\frac{1}{n}\right)}}

により算出する。 両群の平均が等しい場合には「統計量T自由度ν = m + n – 2 のt分布に従う」ので、これを帰無仮説として両側検定を行う。 このt分布におけるt0の上側のp値を求め、有意水準αと比較する(あるいは数表で比較を行う)。p < α ならば帰無仮説は棄却され、「両群の平均には有意差がある」といえる。

[編集] 平均の検定:異分散の場合(ウェルチのt検定)

前と同じ標本(ただし分散が等しくない)を対象とする。

検定統計量t0

t_0=\frac{|\overline{X}-\overline{Y}|}{\sqrt{\frac{U_x}{m}+\frac{U_y}{n}}}

により算出する。 t分布の自由度νは、

\nu=\frac{(\frac{U_x}{m}+\frac{U_y}{n})^2}{\frac{U_x^2}{m^2(m-1)}+\frac{U_y^2}{n^2(n-1)}}

であるが、これは整数になるとは限らないので、10未満の場合は小数自由度のt分布表を利用する。10以上ならば小数部を切り捨て整数部のみを使用してよい。

[編集] 対応のある場合のt検定

n 対のデータがあるとし、対応する2変数をXiYi 、両者の差をdi = Xi - Yi とする(i = 1, 2, ... , n)。di の平均を\overline{d}とする。

検定統計量 t0

t_0=\frac{|\overline{d}|}{\sqrt{\sum_{i=1}^n{(d_i-\overline{d})^2}})/\sqrt{n(n-1)}}

により算出する。 t分布の自由度はν = n -1となる。

[編集] 用語

[編集] t値

t値とは

この節は執筆の途中です この節は執筆中です。加筆、訂正して下さる協力者を求めています

[編集] t検定に対応するノンパラメトリック検定

t検定は正規分布を仮定するパラメトリック検定である。この条件が満たされない場合には、対応するノンパラメトリック検定として、

を用いる。