一般化線形混合モデル

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ナビゲーションに移動 検索に移動

一般化線形混合モデル(いっぱんかせんけいこんごうモデル、: Generalized linear mixed model, GLMM)とは、統計学において一般化線形モデルを拡張した統計解析モデルである。さらにこの一般化線形混合モデルを拡張し、事前分布に含まれる母数の事前分布を導入する場合には、ベイジアン階層線形モデルとみなされる。

  • 固定効果に加えて変量効果を考慮している。変量効果は通常、正規分布を仮定される。変量効果の積分を含めて最尤法に基づき解を求めるが、一般に解析形式で式を表現することができない。そのため、数値積分マルコフ連鎖モンテカルロ法等を用いて計算機により数値解析的に解を求める。コンピュータの高速化により実用化されてきている。
  • 逆ロジット関数のようなリンク関数のほかにも、多くのリンク関数を用いて、ベルヌイ分布以外の確率分布に回帰式をリンクできることが利点である。

モデル[編集]

一般化線形混合モデルは、一般に、ランダム効果 を条件とする従属変数 指数型分布族に従って分布し、その期待値がリンク関数 を介して線形予測子 に関連する、として定義される。

ここで、 は固定効果 のデザイン行列、 はランダム効果 のデザイン行列である。 この簡潔な定義を理解するためには、一般化線形モデル混合モデルについての説明を参照のこと。 一般化線形混合モデルは、階層型一般化線形モデルのうち、ランダム効果の正規分布を仮定したものと考えることもできる。

完全尤度 は次式で表され、多くの場合、膨大な計算量が必要になる[1]

Gauss-Hermite 求積法などによる数値積分のほか、ラプラス近似を用いた方法も提案されている [2]。 罰則つき疑似尤度法(penalized quasi-likelihood method)は、重み付き正規混合モデルを作業変数で繰り返しフィッティングするものであり、多くの商用ないしオープンソースの統計プログラムで実装されている[3]

モデルのフィッティング[編集]

最尤法による一般化線形混合モデルのフィッティングにはランダム効果の積分が必要だが、一般的に、解析的な形では表現できない。様々な近似法が開発されたが、どんなモデルとデータセットにも上手く適用できるような方法はない。このため、計算能力の向上と手法の進歩により、数値積分マルコフ連鎖モンテカルロ法が広く用いられるようになった。

モデル選択の基準としては、赤池情報量規準(AIC)が一般的である。最近、ある指数型分布族の分布に基づく、一般化線形混合モデルの AIC の推定値が得られた[4]

ソフトウェア[編集]

  • R言語[5][6]
  • SAS および SPSS[7]
  • Matlab – 関数 "fitglme" で一般化線形混合モデルをフィッティング
  • Python – Statsmopdels パッケージ[8]

関連項目[編集]

脚注[編集]

[脚注の使い方]
  1. ^ Pawitan, Yudi. In All Likelihood: Statistical Modelling and Inference Using Likelihood (Paperbackition ed.). OUP Oxford. pp. 459. ISBN 978-0199671229 
  2. ^ Breslow, N. E.; Clayton, D. G. (20 December 2012). “Approximate Inference in Generalized Linear Mixed Models”. Journal of the American Statistical Association 88 (421): 9–25. doi:10.1080/01621459.1993.10594284. 
  3. ^ Wolfinger, Russ; O'connell, Michael (December 1993). “Generalized linear mixed models a pseudo-likelihood approach”. Journal of Statistical Computation and Simulation 48 (3-4): 233–243. doi:10.1080/00949659308811554. 
  4. ^ Saefken, B.; Kneib, T.; van Waveren, C.-S.; Greven, S. (2014), “A unifying approach to the estimation of the conditional Akaike information in generalized linear mixed models”, Electronic Journal of Statistics 8: 201–225, doi:10.1214/14-EJS881, http://goedoc.uni-goettingen.de/goescholar/bitstream/handle/1/10640/euclid.ejs.1393510264.pdf?sequence=1 
  5. ^ Pinheiro, J. C.; Bates, D. M. (2000), Mixed-effects models in S and S-PLUS, Springer, New York 
  6. ^ Berridge, D. M.; Crouchley, R. (2011), Multivariate Generalized Linear Mixed Models Using R, CRC Press 
  7. ^ IBM Knowledge Center”. www.ibm.com. 2017年12月6日閲覧。
  8. ^ Statsmodels Documentation”. www.statsmodels.org. 2021年3月17日閲覧。

参考文献[編集]

  • Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied longitudinal analysis. Hoboken, NJ: Wiley-Interscience. ISBN 0-471-21487-6