最小二乗法

| 統計学 |
| 回帰分析 |
|---|
| モデル |
| 推定 |
| 背景 |
最小二乗法(さいしょうにじょうほう、さいしょうじじょうほう;最小自乗法とも書く、英: least squares method)は、誤差を伴う測定値の処理において、その誤差の二乗の和を最小にするようにし、最も確からしい関係式を求める方法である。測定で得られた数値の組を、適当なモデルから想定される1次関数、対数曲線など特定の関数を用いて近似するときに、想定する関数が測定値に対してよい近似となるように、残差平方和を最小とするような係数を決定する方法[1][2][3]、あるいはそのような方法によって近似を行うことである[1][2][3]。
歴史
[編集]はじめて最小二乗法の概念が発表されたのは1806年にアドリアン=マリ・ルジャンドルが出版した『彗星軌道の決定のための新方法』である。しかし、1809年にカール・フリードリヒ・ガウスが出版した『天体運動論(Theoria motus)』の中で1795年頃から最小二乗法を用いて天体の軌道を計算していることを述べた(実際に1801年大晦日、小惑星セレスの軌道をガウスは当てている)ため、その後ドイツとフランスで最小二乗法の先見者の激しい論争が起こった。[4]
ルジャンドルは現在広く知られている正規方程式を作り出すなどの功績を残した。ガウスは最小二乗法の発見後、1797年から1798年の二年間、誤差の確率分布の研究に専念し、正規分布を発見した。さらに、もし誤差が正規分布に従うならば、最小二乗法によって推定された回帰係数が最尤推定値に一致することを証明している。[5] このような功績から(ルジャンドルの研究には確率論的な要素が不足していることもあり)最小二乗法を確立したのはガウスとされるのが一般的である。[6]
また、1812年にピエール=シモン・ラプラスは『確率の解析的理論(Analytical Theory of Probabilities)』において最小二乗法の確率論的根拠を論じており、独立な誤差の和の確率分布が正規分布に従うこと(中心極限定理)を証明している。[7]
計算の概要
[編集]前提条件
[編集]最小二乗法では測定データ はモデル関数 と誤差 の和で
と表せるとする。物理現象の測定データには、誤差が含まれ、それは系統誤差と偶然誤差を含んでいる。この内、偶然誤差は、測定における信号経路の微視的現象に由来するならば、正規分布であると期待されることが多い。また、社会調査などの誤差理由の特定が困難な場合でも誤差が正規分布になると期待する考え方もある。
誤差が正規分布に従わない場合、最小二乗法によって得られたモデル関数はもっともらしくないことに注意する必要がある。偶然誤差が正規分布していない場合、系統誤差が無視できない位大きくそれをモデル関数に含めていない場合、測定データに正規分布から大きく外れた外れ値を含む場合などが該当する。
基礎的な考え方
[編集]話を簡単にするため、測定値は の二次元の平面に分布するものとし、想定される分布(モデル関数)が の形である場合を述べる。想定している関数 は、既知の関数 の線型結合で表されていると仮定する。すなわち、
例えば、 は、多項式近似であり、特に の時は という直線による近似(線形回帰)になる。
今、測定で得られた、次のような数値の組の集合があるとする。
これら の分布が、 というモデル関数に従うと仮定した時、想定される理論値は
ということになり、実際の測定値との残差は、各 につき ということになる。
この残差の大きさは、 平面上での と との距離でもある。
ここで、理論値からの誤差の分散の推定値は残差の平方和
で与えられるから、 が最小になるように想定分布 を(すなわち を)、定めればよいということになる。
それには、上式は を変数とする関数と見なすことができるので、 を について偏微分したものを 0 と置く。こうして得られた 個の連立方程式(正規方程式)を解き、 を決定すればよい。
一次方程式の場合
[編集]さらに簡単な例として、モデル関数を1次関数とし、
とおくと、 は次式で求められる。
解法例
[編集]当てはめたい関数 は、
と表すことができる。上付き添字 T は転置行列を表す。最小にすべき関数 は
と表される。ここに は、 なる成分を持つ 行列、、係数 である。
これの最小解 は、 を満たす上三角行列の計算を経て、解 を得ることができ、全体の計算量に無駄が少ない。下記の表式を用いると が得られ、 から係数解 を求める[注釈 2]。
また前節で述べたように J をのそれぞれの成分で偏微分して 0 と置いた 個の式(正規方程式)は行列を用いて、
と表される。これを正規方程式(英: normal equation)と呼ぶ。この正規方程式を解けば係数解 が求まる。
係数解 の解法には以下のようないくつかの方法がある。
- 逆行列で正規方程式を解く
- 行列 が正則行列(つまりフルランク)である場合は、解 は一意に求まる。ただし の逆行列を明示的に求めることは通常は良い方法ではない。
拡張
[編集]多次元
[編集]想定される分布が媒介変数 t を用いて の形(あるいは は複数の媒介変数によって決まるとしても同様)であっても考察される。
すなわち、測定値 がパラメータ に対する を理論値として近似されているものと考えるのである。
この場合、各点の理論値 と測定値 の間に生じる残差は
である。故に、残差平方和は
となるから、この値が最小であるように、 を決定するのである。
このように、 組の の測定値 を 組の の測定値 に拡張したものも考察することができる。
測定の誤差が既知の場合
[編集]回の測定における誤差があらかじめ分かっている場合を考える。異なる測定方法で測定した複数のデータ列を結合する場合などでは、測定ごとに誤差が異なることはしばしばある。誤差が正規分布していると考え、その標準偏差 で、誤差の大きさを表す。すると、誤差が大きい測定より、誤差が小さい測定の結果により重みをつけて近似関数を与えるべきであるから、
を、最小にするように f を定める方がより正確な近似を与える。
毎回の測定が独立ならば、測定値の尤度は に比例する。そこで、上記の を最小にする は、最尤推定値であるとも解釈できる。また、 は自由度 のカイ二乗分布[11]に従うので、それを用いてモデル の妥当性を検定することもできる。
毎回の測定誤差が同じ場合、 を最小にするのは を最小にするのと同じ意味になる。
非線形最小二乗法
[編集]もし、 が、 の線型結合で表されないときは、正規方程式を用いた解法は使えず、反復解法を用いて数値的に の近似値を求める必要がある。例えば、ガウス・ニュートン法[12]やレーベンバーグ・マーカート法[13][14][15][16][17]が用いられる。とくにレーベンバーグ・マーカート法(英: Levenberg-Marquardt Method)は多くの多次元非線形関数でパラメータを発散させずに効率よく収束させる(探索する)方法として知られている[14][15][16]。
異常値の除去
[編集]前提条件の節で述べたように、測定データを最小二乗法によって近似する場合、外れ値または異常値が含まれていると極端に近似の尤もらしさが低下することがある。また、様々な要因によって異常値を含む測定はしばしば得られるものである。
誤差が正規分布から極端に外れた異常値を取り除くための方法として修正トンプソン-τ法が用いられる[18]。
関連項目
[編集]脚注
[編集]注釈
[編集]出典
[編集]- 1 2 3 中川徹; 小柳義夫『最小二乗法による実験データ解析』東京大学出版会、1982年、30頁。ISBN 4-13-064067-4。
- 1 2 3 Lawson, Charles L.; Hanson, Richard J. (1995). Solving Least Squares Problems. Society for Industrial and Applied Mathematics. doi:10.1137/1.9781611971217(
要購読契約) - 1 2 3 Björck, Åke (1996). Numerical Methods for Least Squares Problems. Society for Industrial and Applied Mathematics. doi:10.1137/1.9781611971484
- ↑ 高増潔「精密測定における最小二乗法の使い方」『精密工学会誌』2010年、76巻10号、p.1130
- ↑ 末吉俊幸「最小絶対値法による回帰分析」『Journal of the Operations Research』1997年、40巻2号、p.262
- ↑ 高増潔「精密測定における最小二乗法の使い方」『精密工学会誌』2010年、76巻10号、p.1130
- ↑ 長岡一夫「ド・モルガンの『確率論』ーラプラスの『確率の解析的理論』の再生」『科学史研究』31巻181号、1992年、p.34
- 1 2 山本哲朗『数値解析入門』(増訂版)サイエンス社〈サイエンスライブラリ 現代数学への入門 14〉、2003年6月。ISBN 4-7819-1038-6。
- ↑ Hansen, Per Christian (1987). “The truncated SVD as a method for regularization”. BIT Numerical Mathematics (Springer) 27: 534-553. doi:10.1007/BF01937276. (
要購読契約) - ↑ 安川章. (2017). 科学実験/画像変換の近似計算に便利な 「疑似逆行列」 入門 できる人が使っている最小二乗法の一発フィット. インターフェース= Interface, 43(8), 142-146.
- ↑ Weisstein, Eric W. "Chi-Squared Distribution." From MathWorld--A Wolfram Web Resource. mathworld
.wolfram .com /Chi-SquaredDistribution .html - ↑ MAGREÑÁN, Alberto; Argyros, Ioannis (2018). A contemporary study of iterative methods: convergence, dynamics and applications. Academic Press
- ↑
Weisstein, Eric W. "Levenberg-Marquardt Method." From MathWorld--A Wolfram Web Resource. mathworld
.wolfram .com /Levenberg-MarquardtMethod .html - 1 2 Moré Jorge J. (1978). “The Levenberg-Marquardt algorithm : Implementation and theory”. Lecture Notes in Mathematics 630: 105-116. doi:10.1007/BFb0067700. (
要購読契約) - 1 2 Yu, H., & Wilamowski, B. M. (2011). Levenberg-marquardt training. Industrial electronics handbook, 5(12), 1.
- 1 2 Ranganathan, Ananth (2004). “The levenberg-marquardt algorithm” (PDF). Tutoral on LM algorithm 11 (1): 101-110.
- ↑ 山下信雄, 福島雅夫「Levenberg-Marquardt法の局所収束性について (最適化の数理科学)」『数理解析研究所講究録』第1174巻、京都大学数理解析研究所、2000年10月、161-168頁、CRID 1050001201691367552、hdl:2433/64462、ISSN 1880-2818。
- ↑ Michele Rienzner (2020). Find Outliers with Thompson Tau (www
.mathworks ), MATLAB Central File Exchange. Retrieved May 17, 2020..com /matlabcentral /fileexchange /27553-find-outliers-with-thompson-tau - ↑ Van Huffel, S., & Vandewalle, J. (1991). The total least squares problem: computational aspects and analysis (Vol. 9). SIAM.
- ↑ Golub, Gene H; Van Loan, Charles F (1980). “An analysis of the total least squares problem”. SIAM journal on numerical analysis (SIAM) 17 (6): 883-893. doi:10.1137/0717073.
- ↑ Drygas, H. (2012). The coordinate-free approach to Gauss-Markov estimation (Vol. 40). Springer Science & Business Media.
- ↑ Motulsky, H., & Christopoulos, A. (2004). Fitting models to biological data using linear and nonlinear regression: a practical guide to curve fitting. Oxford University Press.