非線形最小二乗法

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

非線形最小二乗法 [1] [2] (ひせんけいさいしょうにじょうほう、Non-linear least squares)とは、 非線形な観測データに対するカーブフィッティング手法の一つである。非線形最小二乗法は、未知パラメータ(フィッティングパラメータ) [脚注 1] を持つ非線形モデルを用いて、観測データを記述することを目的とする。即ち、データに最も当てはまりの良い [脚注 2] フィッティングパラメータを推定するの一つである。

目次

関数関係が陽に与えられている場合 [編集]

最小二乗法の主張 [編集]

m 個のデータポイント (x_1, y_1), (x_2, y_2),\dots,(x_m, y_m) からなるセットに対し、n個のフィッティングパラメータ {\beta}_{1}, {\beta}_{2},\cdots,{\beta}_{n}を持つモデル関数

y=f(x, \boldsymbol \beta),

をあてはめる場合を考える。ここで、それぞれのデータ(x_m, y_m)において、{x}_{i}は、説明変数とし、{y}_{i}は、目的変数とする。\boldsymbol \beta = (\beta_1, \beta_2, \dots, \beta_n), は、前記のn個のフィッティングパラメータ{\beta}_{i}からなる、実数ベクトルとする。

また、以下で定まる残差 (errors)

r_i= y_i - f(x_i, \boldsymbol \beta)   ( i=1, 2,\dots, m.)

それぞれは、それぞれ、期待値0、標準偏差{\sigma}_{i}正規分布に従うとする。 また、話を簡単にするため、{x}_{i}それぞれは、いずれも誤差を持たないとする。

このとき、考えるべき問題は、もっとも当てはまりのよい\boldsymbol \betaを見つけ出すことである。

非線形最小二乗法では、以下の残差平方和(より正確に言えば、「規格化された残差平方和」)

S(\boldsymbol \beta)
={\sum}_{i=1}^{n}
\frac{
({r}_{i})^{2}
}{
2{\sigma}_{i}^{2}
}
={\sum}_{i=1}^{n}
\frac{
({y}_{i} - f({x}_{i}, \boldsymbol{\beta}))^{2}
}{
2{\sigma}_{i}^{2}
}

を、最小とするような\boldsymbol \betaが、 もっとも当てはまりの良いfを与えるフィッティングパラメータと考える[1][2] [脚注 3]

残差すべてが同一の標準偏差を持つとき [編集]

尚、上記の場合において、一つの特別な状況として、いずれの残差の標準偏差も、全て同じ値\sigmaである時、 即ち、{r}_{i}それぞれが、期待値0、標準偏差{\sigma}_{i}正規分布に従う場合には、残差平方和 Sから、 \frac{1}{2{\sigma}_{i}^{2}} がくくりだせる。従って、この場合には、最小二乗法は、

{\sum}_{i=1}^{n}
(y_i - f(x_i, \boldsymbol \beta))^2

を、「最小とするような\boldsymbol \betaが、最もあてはまり通い」と考えるのと 同等である。

最小二乗法の尤もらしさ [編集]

最小二乗法の尤もらしさについて、確率論を援用して検討する[2]。 仮定より、残差 (errors) ri それぞれは、いずれも、期待値0、標準偏差\sigma正規分布に従うため、 あるデータセット(x_i, y_i)において、その測定値がyiとなる確率{P}({y}_{i})は、

{P}({y}_{i})=\frac{1}{\sigma\sqrt{2\pi}}\exp(-\frac{{r}_{i}^{2}}{2\sigma^2})

となる。これに、riの定義を考え合わせると、


{P}({y}_{i})
=\frac{1}{\sigma\sqrt{2\pi}}
\exp(
-\frac{
(y_i - f(x_i, \boldsymbol \beta))^{2}}
{2\sigma^{2}}
)

となる。今、残差の値それぞれはランダムであるため、m 個のデータポイントのセット(x_1, y_1), (x_2, y_2),\dots,(x_m, y_m) は、独立試行と考えられ、したがって、m 個のデータポイントのセット(x_1, y_1), (x_2, y_2),\dots,(x_m, y_m) が得られる確率P({y}_{1},\cdots,{y}_{n})は、

P({y}_{1},\cdots,{y}_{n})=P({y}_{i})\cdot P({y}_{2})\cdot \cdots \cdot P({y}_{n})

となる。従って、

P({y}_{1},\cdots,{y}_{n})

={\Pi}_{i=1}^{n}
\frac{1}{
\sigma\sqrt{2\pi}
}\exp(-\frac
{y_i - f(x_i, \boldsymbol \beta)}{2{\sigma}^{2}})
=\frac{1}{(\sigma\sqrt{2\pi})^n}\exp({\sum}_{i=1}^{n}(-\frac{y_i - f(x_i, \boldsymbol \beta)}{2\sigma^2}))

となる。ここで、{\Pi}_{i=1}^{n}は、連乗積を表す。

上式において、正規分布の単峰性より、P({y}_{1},\cdots,{y}_{n})は、

{\chi}^{2}
={\sum}_{i=1}^{n}\frac{
{(y_i - f(x_i, \boldsymbol \beta))}^2
}{
2{\sigma}^{2}
}

が最小(最も0に近いとき)において、最大(最尤)となる。すなわち、最尤法の教えるところによれば、このとき、もっとも当てはまりがよいと考えるのが 妥当だろうということになる。

Sの極値点 [編集]

我々が考えるべき問題は、規格化された残差平方和

S(\boldsymbol \beta)
={\sum}_{i=1}^{n}
\frac{
({r}_{i})^{2}
}{
2{\sigma}_{i}^{2}
}
={\sum}_{i=1}^{n}
\frac{
({y}_{i} - f({x}_{i}, \boldsymbol{\beta}))^{2}
}{
2{\sigma}_{i}^{2}
}

を、最小とするような\boldsymbol \betaを見つけることである。

このような\boldsymbol \betaにおいて、S勾配\boldsymbol{\mathsf{grad}} S は、0になる(必要条件)。 従って、このような、\boldsymbol \betaは、以下の勾配方程式の解となる。

\frac{\partial S}{\partial \beta_j}=2\sum_i r_i\frac{\partial r_i}{\partial \beta_j}=0 \quad (j=1,\ldots,n).

脚注・参考文献 [編集]

参考文献 [編集]

  1. ^ a b 本間 仁,春日屋 伸昌「次元解析・最小二乗法と実験式」コロナ社(1989)
  2. ^ a b c T. Strutz: Data Fitting and Uncertainty (A practical introduction to weighted least squares and beyond). Vieweg+Teubner, ISBN 978-3-8348-1022-9.
    Ch6に、非線形最小二乗法の尤もらしさに関する記述が記載されている。

脚注 [編集]

  1. ^ フィッティングパラメータの個数をn個、データの個数をm個としたとき、少なくともm > n でなければナンセンスとなる。
  2. ^ 実際には、重解が出る場合も多い。
  3. ^ 「残差平方和を最小とするような\boldsymbol \betaが、最適」という考え方は、数多ある考え方の一つに過ぎない。 他の考え方としては、例えば{\sum}_{i=1}^{n}|{r}_{i}|を最小にする考え方等があり、 この考え方で”最適”となったフッティングパラメータは、最小二乗法では”最適”とは限らない。

関連項目 [編集]