ジャック-ベラ検定

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

ジャック=ベラ検定(ジャック=ベラけんてい、: Jarque–Bera test)とは、統計学において標本データが正規分布に従う尖度歪度を有しているかどうかを調べる適合度検定である。検定名はCarlos JarqueとAnil K. Beraにちなんで名づけられた。

概要[編集]

検定統計量JBは以下のように定義される。


    \mathit{JB} = \frac{n}{6} \left[ S^2 + \frac14 (K-3)^2 \right]

ここで、nは標本数、Sは標本歪度、Kは標本尖度である。S及びKは次式で表される。

\begin{align}
    & S = \frac{ \hat{\mu}_3 }{ \hat{\sigma}^3 } 
        = \frac{\frac1n \sum_{i=1}^n (x_i-\bar{x})^3} {\left[\frac1n \sum_{i=1}^n (x_i-\bar{x})^2 \right]^{3/2}} \\
    & K = \frac{ \hat{\mu}_4 }{ \hat{\sigma}^4 }  
        = \frac{\frac1n \sum_{i=1}^n (x_i-\bar{x})^4} {\left[\frac1n \sum_{i=1}^n (x_i-\bar{x})^2 \right]^2} 
  \end{align}

ここで、\hat{\mu}_3\hat{\mu}_4はそれぞれ三次及び四次中心モーメントの推計値、\bar{x}は標本平均\hat{\sigma}^2は二次中心モーメントの推計値(すなわち分散)である。

標本データが正規分布から得られたとすれば、統計量JBは漸近的に自由度2のカイ二乗分布に従う。そのため、統計量JBは標本データが正規分布由来であるという仮説を検定するのに利用できる。帰無仮説は歪度がゼロであるという仮説と過剰尖度がゼロであるという仮説の結合仮説である。正規分布由来の標本は歪度の期待値が0及び過剰尖度の期待値が0(尖度3と等しい)である。統計量JBの定義が示す通り、歪度と尖度が0から逸脱するとJBの値は増加する。

標本数が少ない場合[編集]

標本数が少ない場合、カイ二乗近似は過剰に敏感に働く。すなわち、実際には帰無仮説が正しくても、検定によって帰無仮説がしばしば棄却される。その上、p値の分布は単一分布から逸脱し右にひずんだ単峰の分布となる。特にp値が小さい場合は分布のひずみの影響が大きくなる。こうして、第一種の過誤率αが上昇する。下表にカイ二乗分布から近似したp値を示す。標本数が少ない場合p値が真のαと異なるとわかる。

真のα値と標本数を変化させたときの近似p値との対応
真のα値 標本数
20 30 50 70 100
0.1 0.307 0.252 0.201 0.183 0.1560
0.05 0.1461 0.109 0.079 0.067 0.062
0.025 0.051 0.0303 0.020 0.016 0.0168
0.01 0.0064 0.0033 0.0015 0.0012 0.002

(これらの値はMATLABモンテカルロシミュレーションから近似された値である。)

MATLABでは、標本数が大きい(2000以上)ときのみJB統計量分布をカイ二乗で近似する。標本数が2000未満の場合MATLABはp値を補間するためにモンテカルロシミュレーションから得られた表を用いる。


歴史[編集]

Bowman and Shenton は1975年に発表した論文で、統計量JBがカイ二乗分布に漸近すると言及した(Bowman & Shenton 1975) 。しかし彼らは「カイ二乗近似が成立するためには大量の標本数が必要なことは疑いない。」とも言及している。彼らはD'AgostinoのK二乗検定を支持し、JBの性質についてそれ以上の研究はしなかった。

1979年ごろ回帰分析に関する博士論文の研究をしていたAnil BeraとCarlos Jarqueは観察されていない回帰残差の正規性を検定するためにラグランジュの未定乗数法ピアソン族の分布に適用した。その結果、ジャック-ベラ検定が漸近的に最適であることを彼らは発見した。(漸近に達するには非常に多くの標本数を要するのだが。)1980年に彼らは論文を発表した(Jarque & Bera 1980)。その論文では、正規性等分散性および線形回帰モデルに由来する残差に自己相関がないことを連続的に検定するためのより発展的な事例を取り扱った。ジャック-ベラ検定はその論文内でより単純な事例として言及されたものである。ジャック-ベラ検定に関する完全な論文は1987年にInternational Statistical Reviewで発表された。その論文では観察値の正規性の検定と観察されていない回帰残差の正規性の検定の両方を取扱い、有限標本の有意点を与えた。

ジャック-ベラ検定を実行できるソフトウェア[編集]

参考文献[編集]

  • Bowman, K.O.; Shenton, L.R. (1975). “Omnibus contours for departures from normality based on √b1 and b2”. Biometrika 62 (2): 243–250. JSTOR 2335355. 
  • Jarque, Carlos M.; Bera, Anil K. (1980). “Efficient tests for normality, homoscedasticity and serial independence of regression residuals”. Economics Letters 6 (3): 255–259. doi:10.1016/0165-1765(80)90024-5. 
  • Jarque, Carlos M.; Bera, Anil K. (1981). “Efficient tests for normality, homoscedasticity and serial independence of regression residuals: Monte Carlo evidence”. Economics Letters 7 (4): 313–318. doi:10.1016/0165-1765(81)90035-5. 
  • Jarque, Carlos M.; Bera, Anil K. (1987). “A test for normality of observations and regression residuals”. International Statistical Review 55 (2): 163–172. JSTOR 1403192. 
  • Judge; et al. (1988). Introduction and the theory and practice of econometrics (3rd ed.). pp. 890–892. 
  • Jarque-Bera検定 - MATLAB”. MathWorks. 2012年5月25日閲覧。
  • 向井文雄編著 『生物統計学』 化学同人〈基礎生物学テキストシリーズ〉、2011年、121頁。ISBN 978-4-7598-1109-4

関連項目[編集]

以下の検定手法はいずれもジャック-ベラの検定と同様に正規性の検定に用いられる。