交差検証

交差検定（英: Cross-validation）とは、統計学において標本データを分割し、その一部をまず解析して、残る部分を最初の解析の仮説検定に用いる手法^[1] ^[2] ^[3]。

最初に解析するデータを「訓練事例（training set）」などと呼び、他のデータを「テスト事例（testing sets）」などと呼ぶ。

交差検定は Seymour Geisser が生み出した。特にそれ以上標本を集めるのが困難（危険だったり、コストがかかったり）な場合、データが示唆する仮説を検証することに慎重になる必要がある。

交差検定の主な種類

ホールドアウト検定

一般にホールドアウト検定は交差検定には分類されない。なぜなら、データを交差させることがないためである。初期標本群から事例を無作為に選択してテスト事例を形成し、残る事例を訓練事例とする。テスト事例に使われるのは初期の標本群の3分の1以下の場合が多い^[4]。

K-分割交差検定

英名では"K-fold cross-validation"。K-分割交差検定では、標本群をK個に分割する。そして、そのうちの1つをテスト事例とし、残る K − 1 個を訓練事例とするのが一般的である。交差検定は、K 個に分割された標本群それぞれをテスト事例として k 回検定を行う。そうやって得られた k 回の結果を平均して1つの推定を得る。

LOOCV

leave-one-out cross-validation の略。名前の通り、標本群から1つの事例だけを抜き出してテスト事例とし、残りを訓練事例とする。これを全事例が一回ずつテスト事例となるよう検定を繰り返す。これはK-分割交差検定の K を標本数にした場合と同じである。ただし、LOOCV にはカーネル回帰やティホノフ正規化といった効率的アルゴリズムが存在する。

誤差見積り

パラメータ推定誤差は計算で求めることができる。平均平方誤差（MSE）は分散、平均平方二乗誤差（RMSE）は標準偏差に用いられる。

脚注

^ Kohavi, Ron (1995年). “A study of cross-validation and bootstrap for accuracy estimation and model selection”. Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence 2 (12): 1137–1143. (Morgan Kaufmann, San Mateo)
^ Chang, J., Luo, Y., and Su, K. 1992. GPSM: a Generalized Probabilistic Semantic Model for ambiguity resolution. In Proceedings of the 30th Annual Meeting on Association For Computational Linguistics (Newark, Delaware, June 28 - July 02, 1992). Annual Meeting of the ACL. Association for Computational Linguistics, Morristown, NJ, 177-184
^ Devijver, P. A., and J. Kittler, Pattern Recognition: A Statistical Approach, Prentice-Hall, London, 1982
^ “Tutorial 12”. Decision Trees Interactive Tutorial and Resources. 2006年6月21日閲覧。

外部リンク

Naive Bayes implementation with cross-validation in Visual Basic - ソースコードと実行形式がある
汎用のK-分割交差検定の実装 - フリーなオープンソース。複数台のコンピュータで実行可能な分散バージョンもある。

[Kohavi95-1] Kohavi, Ron (1995年). “A study of cross-validation and bootstrap for accuracy estimation and model selection”. Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence 2 (12): 1137–1143. (Morgan Kaufmann, San Mateo)

[Chang92-2] Chang, J., Luo, Y., and Su, K. 1992. GPSM: a Generalized Probabilistic Semantic Model for ambiguity resolution. In Proceedings of the 30th Annual Meeting on Association For Computational Linguistics (Newark, Delaware, June 28 - July 02, 1992). Annual Meeting of the ACL. Association for Computational Linguistics, Morristown, NJ, 177-184

[Devijver82-3] Devijver, P. A., and J. Kittler, Pattern Recognition: A Statistical Approach, Prentice-Hall, London, 1982

[4] “Tutorial 12”. Decision Trees Interactive Tutorial and Resources. 2006年6月21日閲覧。

[1]

[2]

[3]

[4]