マッチング (統計学)

出典: フリー百科事典『ウィキペディア(Wikipedia)』

マッチング(Matching)は、処置とコントロール群(非処置群)とを比較して処置効果を評価する際に用いられる統計手法で、観察研究や準実験など処置(treatment)が無作為に割り付けられていない場合に用いられる。マッチングでは、処置効果を比較できるように、処置群の被験者のそれぞれに対して、コントロール群の中から同様の観測値を持つ被験者を 1 人または複数見つける。よく似た被験者同士をマッチングすることで、処置群とコントロール群の結果を比較して処置効果を推定した場合の交絡によるバイアス(偏り)を低減することができる [1] [2] [3]。初期のマッチング手法である傾向スコア・マッチングは、ルービン因果モデルの一部として開発されたが [4]、モデルの依存性、バイアス、非効率性、および検出力を高めることが示されており、他のマッチング方法と比較して推奨されなくなった [5]

マッチングはドナルド・ルービンによって推進された [4]経済学の分野では、LaLonde が実験に基づく処置効果の推定値をマッチング法による推定値と比較してバイアスがあることを示し、マッチング法を痛烈に批判した [6]。 Dehejia と Wahba(1999)は、LaLondeの批評を再検討し、マッチングが良い解決策であることを示した [7]。同様の批判が政治学[8]社会学[9]のジャーナルで提起されている。

分析[編集]

アウトカムが 2 値変数の場合、マッチングしたデータを分析するための手法として、条件付きロジスティック回帰が最も広く用いられる。対応のある差の検定、マクネマー検定コクラン-マンテル-ヘンツェル検定などの単純な検定が利用できる場合もある。

アウトカムが連続変数の場合、平均処置効果が推定される。

マッチングは回帰分析など他の手法で分析するための「前処理」として利用することもできる [10]

オーバーマッチング[編集]

オーバーマッチング(Overmatching)とは、中間因子(処置の影響を受け、さらにその結果としてアウトカムに影響を及ぼすもの)によるマッチングである。中間因子によって層別化されている場合、処置のアウトカムへの影響があいまいになる可能性が高くなる。オーバーマッチングはバイアスを引き起こす [11]

例として、体外受精(IVF)という処置(治療)と周産期死亡率や出生時体重といったアウトカムとの関連を推定することを考える。体外受精は早産や多胎児のリスクを高め、その結果として周産期死亡率や出生時体重に影響する、という機序が想定される。中間因子である妊娠期間や胎児数がよく似た被験者同士がマッチングすると、体外受精によって早産や多胎児のリスクが高まることによるアウトカムへの影響が見えなくなってしまう [12]

処置に関連した項目についてよく似た症例同士がマッチングされる。研究の外的妥当性を低下させるサンプリングバイアスと見なすことができる。

関連項目[編集]

参考文献[編集]

  1. ^ Rubin, Donald B. (1973). “Matching to Remove Bias in Observational Studies”. Biometrics 29 (1): 159–183. doi:10.2307/2529684. JSTOR 2529684. 
  2. ^ Anderson, Dallas W.; Kish, Leslie; Cornell, Richard G. (1980). “On Stratification, Grouping and Matching”. Scandinavian Journal of Statistics 7 (2): 61–66. JSTOR 4615774. 
  3. ^ Kupper, Lawrence L.; Karon, John M.; Kleinbaum, David G.; Morgenstern, Hal; Lewis, Donald K. (1981). “Matching in Epidemiologic Studies: Validity and Efficiency Considerations”. Biometrics 37 (2): 271–291. doi:10.2307/2530417. JSTOR 2530417. PMID 7272415. 
  4. ^ a b Rosenbaum, Paul R.; Rubin, Donald B. (1983). “The Central Role of the Propensity Score in Observational Studies for Causal Effects”. Biometrika 70 (1): 41–55. doi:10.1093/biomet/70.1.41. 
  5. ^ King, Gary; Nielsen, Richard (October 2019). “Why Propensity Scores Should Not Be Used for Matching” (英語). Political Analysis 27 (4): 435–454. doi:10.1017/pan.2019.11. ISSN 1047-1987. https://www.cambridge.org/core/product/identifier/S1047198719000111/type/journal_article. 
  6. ^ LaLonde, Robert J. (1986). “Evaluating the Econometric Evaluations of Training Programs with Experimental Data”. American Economic Review 76 (4): 604–620. JSTOR 1806062. 
  7. ^ Dehejia, R. H.; Wahba, S. (1999). “Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs”. Journal of the American Statistical Association 94 (448): 1053–1062. doi:10.1080/01621459.1999.10473858. http://www.nber.org/papers/w6586.pdf. 
  8. ^ Arceneaux, Kevin; Gerber, Alan S.; Green, Donald P. (2006). “Comparing Experimental and Matching Methods Using a Large-Scale Field Experiment on Voter Mobilization”. Political Analysis 14 (1): 37–62. doi:10.1093/pan/mpj001. 
  9. ^ Arceneaux, Kevin; Gerber, Alan S.; Green, Donald P. (2010). “A Cautionary Note on the Use of Matching to Estimate Causal Effects: An Empirical Example Comparing Matching Estimates to an Experimental Benchmark”. Sociological Methods & Research 39 (2): 256–282. doi:10.1177/0049124110378098. 
  10. ^ Ho, Daniel E.; Imai, Kosuke; King, Gary; Stuart, Elizabeth A. (2007). “Matching as Nonparametric Preprocessing for Reducing Model Dependence in Parametric Causal Inference”. Political Analysis 15 (3): 199–236. doi:10.1093/pan/mpl013. 
  11. ^ Marsh, J. L.; Hutton, J. L.; Binks, K. (2002). “Removal of radiation dose response effects: an example of over-matching”. British Medical Journal 325 (7359): 327–330. doi:10.1136/bmj.325.7359.327. PMC 1123834. PMID 12169512. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1123834/. 
  12. ^ Gissler, M.; Hemminki, E. (1996). “The danger of overmatching in studies of the perinatal mortality and birthweight of infants born after assisted conception”. Eur J Obstet Gynecol Reprod Biol 69 (2): 73–75. doi:10.1016/0301-2115(95)02517-0. PMID 8902436. 

参考文献[編集]

  • Angrist, Joshua D.; Pischke, Jörn-Steffen (2009). “Regression Meets Matching”. Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press. pp. 69–80. ISBN 978-0-691-12034-8