ニューマン＝コイルス法

ニューマン＝コイルス法（ニューマン＝コイルスほう、Newman–Keuls method）またはスチューデント＝ニューマン＝コイルス法（スチューデント＝ニューマン＝コイルスほう、Student–Newman–Keuls〔SNK〕method）は、互いに有意に異なる標本平均を同定するために使われる段階的多重比較手順である^[1]。名称はスチューデント（1927年）^[2]、D・ニューマン^[3]、M・コイルス^[4]に因む。この手順は、3つ以上の標本平均間の有意な差が分散分析（ANOVA）によって明らかにされている時のpost-hoc（事後）検定としてしばしば使われる^[1]。ニューマン＝コイルス法はテューキーの範囲検定と似ており、どちらの手順もスチューデント化された範囲の統計量を使用する^[5]^[6]。テューキーの範囲検定とは異なり、ニューマン＝コイルス法は平均の比較の異なる対に対して異なる臨界値を用いる。ゆえに、この手順は群平均間の有意差をより明らかにしやすく、帰無仮説が真である時にこれを誤って棄却する第一種過誤を起こしやすい。言い換えると、ニューマン＝コイルス法はテューキーの範囲検定よりも検出力が高いが、テューキーの範囲検定よりも保守的でない^[6]^[7]。

歴史[編集]

ニューマン＝コイルス法は1939年にニューマンによって導入され、1952年にコイルスによってさらに発展された。これはテューキーが異なる種類の多重エラー率の概念を提示する前である（1952a^[8]、1952b^[9]、1953^[10]）。

ニューマン＝コイルス法は1950年代や1960年代に人気があった^[要出典]。しかし、多重比較検定においてファミリーワイズエラー率（FWER）の制御が判断基準として受け入れられるようになると、ニューマン＝コイルス法は（群の数が3である特殊な場合を除いて^[11]）FWERを制御しないため、人気がなくなった^[要出典]。1955年、ベンジャミニとホフバーグはこの種の問題に対して、新たな、より甘く、より検出力の高い基準である偽発見率（FDR）を提示した^[12]。2006年、シェイファーは（大規模なシミュレーションによって）ニューマン＝コイルス法が、ある程度の制約付きでFDRを制御することを示した^[13]。

必要な仮定[編集]

ニューマン＝コイルス検定の仮定は、独立した群のt検定の仮定（正規性、等分散性、観測の独立性）と本質的に同じである。ニューマン＝コイルス検定は正規性の違反には非常に頑強である。平均二乗誤差（MSE）が全ての群からのデータに基づくため、等分散性の違反は2標本の場合よりも問題がある。観測の独立の仮定は重要であり、違反してはならない。

手順[編集]

ニューマン＝コイルス法は標本平均を比較する時に段階的アプローチを取る^[14]。平均の比較に先立って、全ての標本平均が順位付けされ、これによって標本平均の順序付けされた範囲（p）が得られる^[1]^[14]。次に、最も大きな標本平均と最も小さな標本平均間の比較が行われる^[14]。最大範囲が4つの平均（p = 4）の場合を考えると、最大の平均と最小の平均との間でニューマン＝コイルス法によって有意差が明らかになれば、この個別の平均の範囲に対する帰無仮説が棄却される。次はより小さな3つの平均の範囲（p = 3）で比較を行う。任意の範囲内の2つの標本平均間に有意差があれば、この段階的比較は最後の2つの平均の比較まで続けて行われる。2つの標本平均間に有意差がなかった場合、その範囲内の全ての帰無仮説は保留され、これ以上の小さな範囲内の比較は必要ではない。

標本平均の範囲
	${\bar {X}}_{1}$	${\bar {X}}_{2}$	${\bar {X}}_{3}$	${\bar {X}}_{4}$
平均値	2	4	6	8
2		2	4	6
4			2	4
6				2

等しいサンプルサイズの2つの平均間で有意差があるかを決定するために、ニューマン＝コイルス法はテューキーの範囲検定で用いられるものと同じ式を用いる。この式では、2つの標本平均間の差を取り、標準誤差で割ることでq値が計算される。

q={\frac {{\bar {X}}_{A}-{\bar {X}}_{B}}{\sqrt {\frac {MSE}{n}}}},

上式において、 $q$ はスチューデント化された範囲の値、 ${\bar {X}}_{A}$ と ${\bar {X}}_{B}$ は範囲内の最大と最小の標本平均、 $MSE$ は分散分析表から取られた誤差分散、 $n$ はサンプルサイズ（標本内の観測の数）を表わす。もし平均のサンプルサイズが等しくない場合（ ${n_{A}}\neq {n_{B}}$ ）は、ニューマン＝コイルス式は以下のように調節される。

q={\frac {{\bar {X}}_{A}-{\bar {X}}_{B}}{\sqrt {{\frac {MSE}{2}}({\frac {1}{n_{A}}}+{\frac {1}{n_{B}}})}}},

上式において、 $n_{A}$ と $n_{B}$ は2つの標本平均のサンプルサイズを表わす。どちらの場合も、MSE（平均二乗誤差）は分析の最初の段階で行われるANOVAから取られる。

計算されると、算出されたq値は、有意レベル（ $\alpha$ ）、ANOVA表からの誤差の自由度（ $\nu$ ）、検定される標本平均の範囲（ $p$ ）に基づくq分布表中のq臨界値（ $q_{\alpha }\,_{\nu }\,_{p}$ ）と比較することができる^[15]。もし算出されたq値がq臨界値と等しいあるいはそれよりも大きい場合、その特定の平均の範囲に対する帰無仮説（H₀: μ_A = μ_B）は棄却される^[15]。範囲内の平均の数はそれぞれの対比較で変わるため、q統計量の臨界値もそれぞれの比較で変わり、これによってニューマン＝コイルス法はテューキーの範囲検定よりも甘く、ゆえにより検出力が高くなる。したがって、ニューマン＝コイルス法を用いて対比較に有意差があると明らかになったとしても、テューキーの範囲検定で分析した時に有意差があるとは限らない^[7]^[15]。逆に言うと、ニューマン＝コイルス法を用いて有意差が見出されなかった場合は、テューキーの範囲検定で検定しても決して有意差は見出されない^[7]。

脚注[編集]

^ ^a ^b ^c Muth, James E. De (2006). Basic Statistics and Pharmaceutical Statistical Applications (2nd ed.). Boca Raton, FL: Chapman and Hall/CRC. pp. 229–259. ISBN 0-849-33799-2
^ Student (1927). “Errors of routine analysis”. Biometrika 19 (1/2): 151–164. doi:10.2307/2332181.
^ Newman D (1939). “The distribution of range in samples from a normal population, expressed in terms of an independent estimate of standard deviation”. Biometrika 31 (1): 20–30. doi:10.1093/biomet/31.1-2.20.
^ Keuls M (1952). “The use of the "studentized range" in connection with an analysis of variance”. Euphytica 1: 112–122. doi:10.1007/bf01908269. オリジナルの2014年11月4日時点におけるアーカイブ。.
^ Broota, K.D. (1989). Experimental Design in Behavioural Research (1st ed.). New Delhi, India: New Age International (P) Ltd.. pp. 81–96. ISBN 8-122-40215-1
^ ^a ^b Sheskin, David J. (1989). Handbook of Parametric and Nonparametric Statistical Procedures (3rd ed.). Boca Raton, FL: CRC Press. pp. 665–756. ISBN 1-584-88440-1
^ ^a ^b ^c Roberts, Maxwell; Russo, Riccardo (1999). “Following up a one-factor between-subjects ANOVA”. A Student's Guide to Analysis of Variance. Filey, United Kindgom: J&L Composition Ltd.. pp. 82–109. ISBN 0-415-16564-4
^ Tukey, J.W (1952a). “Reminder sheets for Allowances for various types of error rates. Unpublished manuscript”. Brown, 1984.
^ Tukey, J.W (1952b). “Reminder sheets for Multiple comparisons. Unpublished manuscript”. Brown, 1984.
^ Tukey, J.W (1953). “The problem of multiple comparisons. Unpublished manuscript”. Brown, 1984.
^ MA Seaman, JR Levin and RC Serlin M (1991). “New Developments in pairwise multiple comparisons: Some powerful and practicable procedures”. Psychological Bulletin: 577–586.
^ Benjamini, Y., Hochberg, Y (1995). “Controlling the false discovery rate: a new and powerful approach to multiple testing”. JRSS, series B,methodological 57: 289–300.
^ Shaffer, Juliet P (2007). “Controlling the false discovery rate with constraints: The Newman-Keuls test revisited”. Biometrical Journal 47: 136–143. PMID 17342955.
^ ^a ^b ^c Toothaker, Larry E. (1993). Multiple Comparison Procedures (Quantitative Applications in the Social Sciences) (2nd ed.). Newburry Park, CA: Chapman and Hall/CRC. pp. 27–45. ISBN 0-803-94177-3
^ ^a ^b ^c Zar, Jerrold H. (1999). Biostatistical Analysis (4th ed.). Newburry Park, CA: Prentice Hall. pp. 208–230. ISBN 0-130-81542-X

歴史[編集]

必要な仮定[編集]

手順[編集]

脚注[編集]

関連項目[編集]