一般化線形モデル

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

一般化線形モデル (いっぱんかせんけいモデル、: Generalized linear model、GLM)は、残差を任意の分布とした線形モデル。似たものとして一般線形モデルがあるが、これは残差が多変量正規分布に従うモデル。一般化線形モデルには線形回帰ポアソン回帰ロジスティック回帰などが含まれる。1972年ネルダーウェダーバーンによって提唱された[1]

概要[編集]

確率変数Y指数分布族である、つまり確率密度関数 f(y) は正準(canonical)パラメーター θ, 分散(dispersion)パラメーター φ とスカラー関数 a(θ), c(y,θ) を用いて指数型

で表せるとする。この平均および分散は、それぞれa ′(θ), φa ″(θ) である。ここで、正準パラメーターθが、リンク関数(link function)と呼ばれる滑らかな関数 g (θ) と、別の確率変数 X の実現値 x を用いて、g (θ) = βT x と表せるとするのが、一般化線形モデルである。

実例[編集]

a(θ) = θ²/2, φ = σ², c(y,θ)  = −(y²/σ² + log 2πσ²) のとき、Y は平均 θ, 分散 σ² の正規分布である。リンク関数として g (θ) = θ (正準リンク<canonical link>とよぶ)を取るとき、平均 θβT x と等しい。これは、通常の線形回帰に相当する。

a(θ) = −log(1 − p) (ただし p = eθ/(1 + eθ) ), φ = 1, c = 0 のとき、Y は生起確率 pベルヌーイ分布(確率 p で1, 確率1 − p で0)である。リンク関数として g (θ) = θ を取るとき、これをロジスティック回帰模型(logistic regression model)とよぶ。Y = 1, 0の確率は、

で与えられる。さらに、リンク関数を g (θ) = Ψ−1 (p) (Ψは標準正規分布の累積分布関数)に取ることで、プロビット模型が得られる。

パラメーターの決定には、ニュートン法を用いた最尤法などがある。

参考文献[編集]

  1. ^ Nelder, John; Wedderburn, Robert (1972). “Generalized Linear Models”. Journal of the Royal Statistical Society. Series A (General) (Blackwell Publishing) 135 (3): 370–384. doi:10.2307/2344614. JSTOR 2344614. 

関連項目[編集]