最尤法
出典: フリー百科事典『ウィキペディア(Wikipedia)』
最尤法(さいゆうほう、Maximum likelihood estimation略してMLEともいう)は、統計学において、与えられたデータからそれが従う確率分布の母数について推測するためによく用いられる方法で、尤度の概念を利用するものである。この方法はロナルド・フィッシャーが1912年から1922年にかけて開発したものである。
現在では生物の系統樹を確率モデルによって作成する際に、データから見て一番尤もらしい系統樹を選択するための有力な方法としても応用される。
目次 |
[編集] 基本的理論
確率分布関数 fD と分布の母数 θ のわかっている離散確率分布 D が与えられたとして、そこから n 個の標本 X1,X2,...Xn を取り出すことを考えよう。すると分布関数から、観察されたデータが得られる確率を次のように計算することができる:
しかし、データが分布 D によることはわかっていても、母数 θ の値はわからないかもしれない。どうしたら θ を見積もれるか? n 個の標本 X1,X2,...Xn があれば、この標本から θ の値を見積もることができる。最尤法は母数 θ の一番尤もらしい値を探す(つまり θ のすべての可能な値の中から、観察されたデータセットの尤度を最大にするものを探す)方法である。これは他の推定量を求める方法と対照的である。たとえば θ の不偏推定量は、 θ を過大評価することも過小評価することもないが、必ずしも一番尤もらしい値を与えるとは限らない。 尤度関数を次のように定義する:
この関数を母数 θ のすべての可能な値から見て最大になるようにする。そのような
の値は、 θ に対する最尤推定量(さいゆうすいていりょう Maximum likelihood estimator、これもMLEと略す)として知られる。
[編集] 注意
- 尤度は θ を変数とし
を定数とする関数である。 - 最尤推定量は唯一ではないこともあるし、存在しないことさえある。
- fD を離散確率分布関数でなく確率密度関数として考えれば、上の定義は連続確率分布にも当てはまる。
- 最尤法をベイジアンで解釈することも可能である.事前分布に一様分布を仮定し,事後分布のモードを計算することと同値である.詳しくは計量経済学のベイジアン計量経済学の項を参照されたい.
[編集] 例
[編集] 離散分布で、母数が離散的かつ有限の場合
以下、コインを投げて表・裏(あるいは成功・失敗:その確率は0.5とは限らない)のいずれが出るかを見る場合(ベルヌーイ試行)を例にとる。 公平でない1個のコインを80回投げることを考える(つまり x1 = H 、 x2 = T 、
、 x80 = T のようなものをサンプリングし、表の観察された回数 H を数える)。表の出る確率を p 、裏の出る確率を 1 − p とする(ここで p は上で θ と書いた母数に等しい)。そして3個のコイン―1個は確率 p = 1 / 3 で、1個は確率 p = 1 / 2 で、残りの1個は確率 p = 2 / 3 でそれぞれ表の出るもの―を含む箱からコインを取り出し、結果として表(H)が49回、裏が31回出たとする。コインは区別できないとする。観察されたデータが与えられたとして、それがどのコインであったと考えるのが一番尤もらしいかを次のように計算する:
こうして母数
によって尤度が最大となることがわかり、これが p に対する最尤推定量である。
[編集] 離散分布で、母数が連続的な場合
こんどは上の例での箱に入っているコインの数は無限であると仮定する。それぞれがすべての可能な
の値をとるとする。するとすべての可能な
の値に対して次の尤度関数を最大化しなければならない:
この関数を最大化するには p に関して微分しその値を0にすればよい:
これを解けば p = 0 、 p = 1 、 p = 49 / 80 の3つの解が得られるが、そのうち尤度を最大化するのは明らかに p = 49 / 80 である( p = 0 と p = 1 では尤度は0になってしまう)。こうして p に対する最尤推定量は
と求められる。 この結果で、ベルヌーイ試行の成功数49を t と置き、全回数80を n と置けば一般化できる。 n 回のベルヌーイ試行で t 回成功した場合に対する最尤推定量は
となる。
[編集] 分布、母数とも連続的な場合
よく出てくる連続確率分布に、次の正規分布がある:
この分布に従う n 個の独立なランダム変数標本の密度関数は:
また計算しやすいように書き換えると:
この分布には μ (平均)、 σ2 (分散)の2つの母数がある。上では1つの母数に対する最大化だけを議論したが、この場合も各母数に対して尤度
を最大化すればよい。上の書き方なら θ = (μ,σ2) とする(このように母数が複数の場合は母数ベクトルとして扱う)。 尤度を最大にするのは、尤度の自然対数を最大にするのと同じである(自然対数は単調増加関数であるから)。このような計算法はいろいろな分野でよく利用され、対数尤度は情報のエントロピーやフィッシャー情報と密接な関係がある。
これを解くと
となる。これはまさに関数の最大値、すなわち μ の唯一の極値で、2次微分は負となる。 同様に、 σ に関して微分し0とおけば尤度の最大値
が得られる。 形式的には、 θ = (μ,σ2) に対する最尤推定量は:
.
となる。
[編集] 系統推定への応用
最尤法は生物の系統推定(系統樹作成)にも応用される。ある確率モデルを仮定した上で、想定される系統樹パターンごとに、現在わかっているデータが得られる確率つまり尤度を求め、より尤度の高いパターンを確からしいものとして採用する方法である。また対数尤度に有意差があるかどうか(尤度比検定)によって、採用したパターンが信頼できるかどうかを調べることもできる。




![\begin{matrix}
0 & = & \frac{d}{dp} \left( \binom{80}{49} p^{49}(1-p)^{31} \right) \\
& & \\
& \propto & 49p^{48}(1-p)^{31} - 31p^{49}(1-p)^{30} \\
& & \\
& = & p^{48}(1-p)^{30}\left[ 49(1-p) - 31p \right] \\
\end{matrix}](http://upload.wikimedia.org/math/f/4/3/f43c984e21445732edf403445fe32ea9.png)






