一般化線形モデル

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

一般化線形モデル (いっぱんかせんけいモデル、英:Generalized linear model、GLM)は、正規分布以外の分布を扱えるように線形回帰モデルを拡張したモデル。ポアソン回帰ロジスティック回帰などが含まれる。ネルダーウェダーバーンによって提唱された[1]

概要[編集]

確率変数Y指数分布族であり、分布関数f(y)は正準(canonical)パラメーターθ, 分散(dispersion)パラメーターφとスカラー関数a(θ), c(y,θ) を用いて

f(y;\theta, \phi)=\exp \{ [y\theta-a(\theta)]/\phi+c(y,\phi) \}

とあらわせるとする。この平均および分散は、それぞれa '(θ), φ a' '(θ)である。ここで、正準パラメーターθが、リンク関数(link function)と呼ばれる滑らかな関数g (θ)と、別の確率変数Xの実現値xを用いて、g (θ)=βT x と表せるとするのが、一般化線形モデルである。

実例[編集]

a(θ)=θ²/2, φ=σ², c(y,θ) -(y²/σ²+log 2πσ²)のとき、Yは平均θ,分散σ²の正規分布である。リンク関数としてg (θ)=θ (正準リンク<canonical link>とよぶ)を取るとき、平均θβT xと等しい。これは、通常の線形回帰に相当する。

a(θ)=-log(1-p) (ただしp=eθ/(1+eθ) ), φ=1, c=0のとき、Yは生起確率pベルヌーイ分布(確率pで1, 確率1-pで0)である。接続関数としてg (θ)=θ を取るとき、これをロジスティック回帰模型(logistic regression model)とよぶ。Y=1,0の確率は、

P(Y=1|x)=\frac{\exp (\beta^T x)}{1+\exp (\beta^T x)}

P(Y=0|x)=\frac{1}{1+\exp (\beta^T x)}

で与えられる。さらに、リンク関数をg (θ)=Ψ-1 (p) (Ψは標準正規分布の累積分布関数)に取ることで、プロビット模型が得られる。

パラメーターの決定には、ニュートン法を用いた最尤法などがある。

関連項目[編集]

参考文献[編集]

  1. ^ Nelder, John; Wedderburn, Robert (1972). “Generalized Linear Models”. Journal of the Royal Statistical Society. Series A (General) (Blackwell Publishing) 135 (3): 370–384. doi:10.2307/2344614. JSTOR 2344614.