ノンパラメトリック手法
統計学において、ノンパラメトリックの手法は母集団の分布について一切の前提を設けないものをいう。このため、分布に関わらない手法(distribution-free method) と呼ばれることもある。
目次 |
適用と目的[編集]
ノンパラメトリック手法は順序尺度(例えばレストランの人気ランキングなど)を分析する際に良く使われる。ランキングには順序が反映されるものの、はっきりとした数値(比率尺度や間隔尺度)を提供されない尺度である。尺度水準と言う点で、ノンパラメトリック手法は順序尺度に基づくものである。
ノンパラメトリック手法はパラメトリック手法と比べて、母集団の分布などの前提を必要としない。そのためノンパラメトリック手法は広きにわたり適用できる(汎用性がある)。事前に詳しい事が解っていないデータや、社会科学や心理学におけるアンケート調査の分析などにおいて、ノンパラメトリック手法は広く使用されている。
ノンパラメトリック手法はどのような場合にも妥当であるため、頑強性がある。ただし、その頑強性にはコストも生じる。ノンパラメトリック検定は、対応するパラメトリック検定(もし前提条件が満たされていれば)と比べて「パワー」が弱い。つまりパラメトリック検定と同じ「信頼」を得ようとした場合、ノンパラメトリック手法ではより多くの標本数を要することになる。パラメトリックとノンパラメトリックには、頑強性と効率性の間でのトレードオフが生じている訳である。
中心極限定理によると、母集団の分布が正規分布に従わないと考えられる少数の標本では、標本平均が正規分布から遠く離れる。そのためt検定などを使うことが出来ず、ノンパラメトリックが数少ない分析手法となってしまう。生態学などにおいて少数の標本しか調査できない場合など、ノンパラメトリック分析が多く使われる。ただし、パラメトリックの代替手法としてノンパラメトリック手法を使用した場合、根本的な帰無仮説が全く異なる事に注意しなければならない。例えば独立二群のt検定の帰無仮説はμ1=μ2であるのに対し、それに対応するマン・ホイットニーのU検定ではP(xi>yj)=0.5である。
各種のノンパラメトリック手法[編集]
- アンダーソン・ダーリン検定 Anderson-Darling test
- シミュレーションによるブートストラップ手法
- コクランのQ Cochran's Q
- コーエンのカッパ Cohen's kappa
- エフロン・ペトロシャンの検定 Efron-Petrosian test
- フリードマン検定 Friedman two-way analysis of variance by ranks
- ケンドールの順位相関係数
- ケンドールの一致度係数 Kendall's W
- コルモゴロフ-スミルノフ検定
- クラスカル・ウォリス検定 Kruskal-Wallis one-way analysis of variance by ranks
- カイパー検定
- マン・ホイットニーのU検定
- マクネマー検定 McNemar's test (a special case of the chi-squared test)
- 中央値検定 median test
- ピットマンの並べ替え検定 Pitman's permutation test
- シーゲル・テューキーの検定 Siegel-Tukey test
- スピアマンの順位相関係数
- スチューデント・ニューマン・クールズの検定 Student-Newman-Keuls test
- ワルド・ウォルフォヴィッツ検定 Wald-Wolfowitz runs test
- ウィルコクソンの符号順位検定
ソフトウェア[編集]
- R言語 各種のノンパラメトリック検定を含む統計解析ができるフリーの統計環境。使い方はRjpWikiに詳しい。
- JavaScript-STAR フリーの分散分析ツールとして有名だが、χ2検定や直接確率計算、Q検定なども行える。
- Excel nag 統計解析 Excelにノンパラメトリック統計関数を追加。