カルマンフィルター

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

カルマンフィルター (Kalman filter) は、誤差のある観測値を用いて、ある動的システムの状態を推定あるいは制御するための、無限インパルス応答フィルターの一種である。

実用例[編集]

カルマンフィルターは、 離散的な誤差のある観測から、時々刻々と時間変化する量(例えばある物体の位置と速度)を推定するために用いられる。レーダーコンピュータビジョンなど、工学分野で広く用いられる。例えば、カーナビゲーションでは、機器内蔵の加速度計人工衛星からの誤差のある情報を統合して、時々刻々変化する自動車の位置を推定するのに応用されている。カルマンフィルターは、目標物の時間変化を支配する法則を活用して、目標物の位置を現在(フィルター)、未来(予測)、過去(内挿あるいは平滑化)に推定することができる。

歴史[編集]

このフィルターはルドルフ・カルマンによって提唱されたが、同様の原理はトルバルド・ティエレピーター・スワーリングによってすでに開発されていた[1]。カルマンがアメリカ航空宇宙局エイムズ研究センターを訪問した際、この理論がロケットの軌道推定に有用なことに気づき、のちのアポロ計画で用いられた。

用いられる動的システム[編集]

カルマンフィルターは時間領域において、連続時間線形動的システム、もしくは離散化された離散時間線型動的システムに基づいて駆動する。以降に導入される解説は、後者の立場のものである。それらはガウス白色雑音によって励振をうける線形演算子からなるマルコフ連鎖モデルで表現される。より端的にいえば、システムは状態空間モデル (state space model) で表現されるということである。

対象のシステムに定義された「状態 (state)」は、そのシステムの過去の動特性の遷移を保持する役割を果たし、動特性の遷移を保持する線形空間が状態空間として定義される。この空間は実数空間であるため、システムの状態は一般に、任意の次元の状態空間に含まれる実数ベクトルとして与えられる。状態の変化は、現在の状態と、それに付加する雑音の影響と、場合によってはシステムの状態の制御に関与する既知の制御入力の線形結合によって記述される。したがって、状態はシステムの因果性に寄与する存在である。上記の理念は、以下に記述する状態方程式 (state equation) によって表現される。 状態が直接観測できない場合には、システムの出力は一般に状態と観測雑音の線形結合にて観測可能なものとして与えられる。この理念は観測方程式 (observation equation) として、以下に示すような線形モデルで表現される。 カルマンフィルターは、直接システムの状態が観測できない問題に対する状態推定法のひとつであるから、一般的に観測方程式を伴う問題に適用される。

カルマンフィルターは隠れマルコフモデル (hidden Markov model) の類似であると考えることができる。2者の主たる差異は隠れマルコフモデルにおける状態変数が、連続であるか離散であるかである。また、隠れマルコフモデルでは状態変数の未来への変化を任意の分布に従う形式で統計的に与えることができる一方で、カルマンフィルターでは、ガウス分布に従う雑音によって未来の状態変数が統計的に記述される点が異なっている。したがって、カルマンフィルターと隠れマルコフモデルの間には強固な双対性が存在する。ちなみに、カルマンフィルターの導出過程においては、「システムに付随する雑音の性質はガウス分布に従う」という仮定の下に行われるのが一般的であるが、雑音の性質がガウス分布に従わない場合であっても、カルマンフィルターは線形なクラスにおける最適推定値、すなわち線形最小分散推定値を導くことができる点で、汎用性に富んでいるといえる。

唯一に観測可能である、雑音の影響を受けた出力過程に基づいて(制御問題においては、入力も観測可能な過程となる)、カルマンフィルターを用いてシステムの状態を推定するためには、対象のシステムに対して、カルマンフィルターの理念に合致するような状態の遷移(すなわち状態過程)に関するモデルを与えなければならない。これは、時変 (time-variant) な行列 , , , , によって特徴付けられる線形方程式として、以下で与えられる。これが状態方程式である。

時刻 における真のシステムの状態は、1ステップ前の時刻 の状態をもとに、次のように表現される[2]

ここに、

  • は、システムの時間遷移に関する線形モデル。
  • は制御入力。
  • は時間遷移に関する雑音 (process noise) モデルの行列で、 はその雑音で、共分散行列 かつ零平均の多変数正規分布に従う。

これがシステムの状態の遷移を記述する状態方程式である。

ある時刻 において、観測量(測定量) は、真の(すなわち観測不可能な)状態 と、以下のような関係にある。

ここに、 は状態空間を観測空間に線形写像する役割を担う観測モデルで、 は、共分散行列 かつ零平均の多変数正規(ガウス)分布に従うような雑音である(観測雑音 (observation noise) )。これが観測方程式である。

システムの初期条件と雑音 は、互いに統計的に独立であると仮定する。

状態方程式と観測方程式を合わせて、状態空間モデルという。上記の状態空間モデルは時変システムを表現しているが、限定的な場合として行列のインデックス を定数と考えることにより、時不変システム (time-invariant) を表現できる。

多くの実動的システムでは、上記のような状態空間モデルは厳密には適合しないが、カルマンフィルターは雑音の影響を加味した上で設計されているがゆえに、上記のモデルが対象システムに近似的に適合するものと考えられ、これが理由でカルマンフィルターは十分な有用性が認められている。カルマンフィルターは洗練された様々な拡張がなされており、それは以降に述べられる。

カルマンフィルター[編集]

カルマンフィルターは、システム(系)の現在の観測量と 1 ステップ前の状態推定値のみから(モデルが制御入力を受ける場合には現在の入力値も用いて)、現在の状態推定値(ろ波推定値)と 1 ステップ先の状態予測値( 1 段予測値)を与える、反復推定器(反復推定型フィルタ)である。例えばローパスフィルタなどの多くのフィルタが周波数領域で設計され、時間領域へ変換されて実演される中で、カルマンフィルターは純粋に時間領域でのみ設計されるフィルタで、その意味で特異な存在であるといえる。カルマンフィルターは基本的に線形なクラスのフィルタであり、システム(系)が無限の過去から駆動し続けていると仮定すると、状態の推定値は、それまでにシステム(系)から観測された観測値の全て(システム(系)が制御入力を受ける場合は入力値の全ても含めて)を用いた線形結合の形で表現される。その意味で、カルマンフィルタは無限インパルス応答フィルタであると解釈できる。反復推定との対応関係は、1 ステップ前の状態推定値が 1 ステップ前までの全ての観測値(入力値も含め)の情報を線形結合の形で保有しているという事実により与えられる。


以降、 は時刻 m 時点での時刻 n の状態推定値を示すものとする。

フィルタの現在(時刻 k )の状態(様子)は、以下の2つの変数で特徴付けられる。

  • システム(系)の状態推定値。
  • 誤差の共分散行列(推定値の精度)。

カルマンフィルターは、時間ステップをひとつ進めるために予測更新の二つの手続きを行う。予測の手続きでは、前の時刻の推定状態から、今の時刻の推定状態を計算する。更新では、今の時刻の観測を用いて、推定値を補正してより正確な状態を推定する。

予測[編集]

(今の時刻の予測推定値)
(今の時刻の予測誤差行列)

更新[編集]

(観測残差、innovation)
(観測残差の共分散)
最適 カルマンゲイン)
(更新された状態の推定値)
(更新された誤差の共分散)

不偏量[編集]

もし、モデルが正確で初期条件 が正確ならば、全ての推定量は不偏である。

ここに、 は、期待値。また、共分散は、推定値の誤差共分散である。

設定例[編集]

まっすぐで無限の長さを持つ摩擦の無いレールの上に乗っているトロッコを考えよう。初期条件は、トロッコは位置 0 に静止している。トロッコにはランダムな 力(加速度)が与えられる。Δt 秒ごとにトロッコの位置 x を観測する。ただしこの観測には誤差が混入している。トロッコの位置と速度のモデルを考えると、以下の様に設定すると、カルマンフィルターが用い得る。

制御の必要はないから、 uk は考えない。行列 FGHRQ は時間変化しないので添字は付けない。

トロッコの場所と速度は、

で、表される。 は位置の時間微分、すなわち速度である。

時刻 k − 1 と時刻 k の間に加速度がトロッコに与えられる。加速度は平均 0 標準偏差の正規分布をしている。運動の第2法則により、

ここに、

かつ

である。の共分散は、がスカラーであることを用いて、

それぞれの時刻に、トロッコの位置を観測する。観測誤差も平均 0 で標準偏差の正規分布と仮定する。

ここに、

かつ

である。

初期条件は正確に分かっているので、

もしも、初期条件に誤差があるならば、誤差の大きさに応じて B を設定し、

と、取るべきである。もし B が大きければカルマンフィルターは、初期条件より、それ以降の観測に重みを置くようになる。

導出[編集]

更新後の共分散行列[編集]

時間を進めるための予測更新の手続きのうち、更新が終わったあとの共分散行列 Pk|k をまず求める。上の定義式、

に、推定値 の定義を代入。

続いて、観測残差 を代入。

そして、観測値 と真の値の関係を代入。

変形して、

観測誤差 vk は、他の項と相関がないから、

となり、さらに変形

して、前述の不偏量 Pk|k-1 と、観測誤差共分散 Rk を用いて、

を得る。この式は、 Kk がどんな値であっても成立するが、 Kk が、最適カルマンゲインの時は、以下のようにさらに簡略化される。

カルマンゲインの導出[編集]

カルマンフィルターは最小平均二乗誤差(minimum mean-square error: MMSE)推定値を与える。すなわち、更新後の誤差の推定値は

であり、このベクトルの大きさの自乗の期待値 を最小にするような推定値を与える。これは、更新後の共分散 Pk|kトレースを最小とすることと同じである。上の式を展開して、

MMSE を導くゲインは、Pk|kのトレースを最小にするから、 必要条件として、Kkによる行列微分は下記が成立しなければならない。

ここからカルマンゲイン Kk を求める。

このゲインは、最適カルマンゲインと呼ばれる。

更新後の誤差共分散行列[編集]

カルマンゲインが上述の値を取るとき、更新後の誤差共分散行列は以下のように簡単になる。カルマンゲインの式の両辺の右から SkKkT をかけて、

更新後の誤差共分散行列を展開して、

右の二項は相殺するから、

.

計算量が少ないため、ほとんどの場合この式が用いられるが、カルマンゲインが上記の最適解の時にしか適用できないことに注意。計算上の桁落ちなどで解の安定性が悪いときやなんらかの理由で敢えて最適でない解を用いるときは使えない。

再帰ベイズ推定との関係[編集]

真の状態は一次マルコフ過程であると仮定され、観測値は隠れマルコフモデルからの観測された状態である。[3] 仮定より、ひとつ前の時刻の状態にのみ依存して

同様に、時刻 k での観測値は現在の状態にだけ依存して、過去には依存しないものとする。

これらの仮定を用いると、隠れマルコフモデルの観測が z1, z2, zk と得られる確率は、

で、表される。

一方、カルマンフィルターで状態 x を求めるには現在の系の状態とそれまでの観測だけを用いる。

カルマンフィルターの予測更新の手続きを、確率を使って表してみる。予測後の状態の確率分布は、時刻 k − 1 から時刻 k への変化に関する確率と、時刻 (k − 1) の状態の積になるから、

時刻 t までの観測は

である。

更新後の確率は観測の起こりやすさ(尤度)と予測された状態の積に比例するから

となる。分母の

は、全確率を 1 にするための因子であまり重要ではない。

他の確率分布関数も

と書ける。


情報フィルター[編集]

情報フィルターもしくは逆共分散フィルターにおいては、カルマンフィルターにおける推定された共分散と状態が、各々フィッシャー情報行列と情報ベクトルに置き換わる。


同様に、予測された共分散と状態は情報形式と等価になり、以下と定義する。


観測共分散と観測ベクトルがあるとして、以下で定義する。


このとき、情報更新は簡便な和算となる。


情報フィルターの主たる優位性は、以下に示すように、N 個の観測値は各時間毎に、観測値の情報行列と情報ベクトルの和算でシンプルにフィルター処理される点である。


情報フィルターを予測するために、情報空間予測を用いることができる[4]




なおであれば、である。F は可逆(正則)の必要がある。 注意すべきは、もし F, G, Q時不変(time invariant)ならば、それらの値は保存しておける点である。

固定区間スムーサー[編集]

固定区間スムーサー(fixed-interval smoother)は、スムーサー解およびは固定値とする)を求める。

Rauch–Tung–Striebel[5]の関係式():

において、の右式はに依存しない。なおは情報フィルターのそれに等しい。

これを用いて固定区間スムーサー解が求められる。すなわちフィルター計算でにおける上記の値を求めておき、それらを用いて、

を逆方向(backward)すなわち、kが減る方向に逐次計算しスムーサー解が求められる。ここで計算が丸め誤差を持っていても、は必ず半正定値となる。

また、上記を変形すると、Bryson–Frazierの固定区間スムーサー[6]と等価の式が得られる。すなわち、

また、Biermanによって上記の変形式が得られている[7]。これは、という逆行列計算を必要とせずスムーサー解を得られる。すなわち、

非線型カルマンフィルター[編集]

ここまでは線形の仮定が成り立つ系をとりあつかってきたが、実際の系の多くは非線型である。時間発展モデルも観測モデルもどちらも非線型になりうる。

拡張カルマンフィルター[編集]

ここでは時間発展モデル

と、観測モデル

を考える。どちらも微分可能であれば線形である必要はない。関数 f は前の状態から推定値を与え、関数 h は観測値を与える。どちらの関数も直接共分散を求めることはできず、偏微分行列(ヤコビアン)を用いる必要がある。

原理としては、非線型モデルを現在の推定値の回りで線形化する。そのためにそれぞれの時刻で、ヤコビアンを計算する。すなわち、

予測

更新

出てくる行列は次のヤコビアンで定義される。

Unscented カルマンフィルター[編集]

非線型性の強いとき、拡張カルマンフィルターの性能は悪い。理由は平均値だけが非線型性に反映されるからである。unscented カルマンフィルターは、シグマ点とよばれる代表点を平均値の回りで用いて、推定値の共分散を計算する。こうすることにより、真の平均と共分散により近い値が得られることがモンテカルロ法や、テイラー展開によって示される。しかも解析的にヤコビアンを計算する必要がなくなるという利点がある。これは複雑なモデルでは有利である。

予測

拡張カルマンフィルタと同様、 unscented カルマンフィルターの予測手続きは更新手続きと別であり、更新手続きに線形カルマンフィルターや拡張カルマンフィルターを用いたり、その逆を行うことも可能である。推定値と共分散には、予測ノイズの平均と共分散項が加えられる。

シグマ点 2L+1 個は、付け加えた項から計算される。ここに L は付け加えた状態項の次元である。

シグマ点は関数 f で時間発展する。

予測値と共分散は重み付き平均で求められる。

重みは以下のように与えられる。




α = 10-3β = 2κ = 0 といった値がよく用いられる。

更新

予測値と共分散には、上と同様に観測値のノイズの平均と共分散項が加えられる。

シグマ点 2L+1 個は、付け加えた項から計算される。ここに L は付け加えた状態項の次元である。

もし、予測手続きも unscented カルマンフィルターで行われていたならば、以下のような変形も可能である。

ここに、

である。シグマ点は関数 h で観測値に変換される。

重み付き平均で、観測値とその共分散を推定する。

推定値と観測値の相関行列

を用いて unscented カルマンゲイン

を計算する。以下は線形の場合と同様である。

応用例[編集]

関連項目[編集]

脚注[編集]

  1. ^ Steffen L. Lauritzen, Thiele: Pioneer in Statistics, Oxford University Press, 2002. ISBN 0-19-850972-3.
  2. ^ 表現式として、の形が用いられることも多い。
  3. ^ C. Johan Masreliez, R D Martin (1977); Robust Bayesian estimation for the linear model and robustifying the Kalman filter, IEEE Trans. Automatic Control
  4. ^ なお、
  5. ^ Rauch, H.E.; Tung, F.; Striebel, C. T. (August 1965). “Maximum likelihood estimates of linear dynamic systems”. AIAA J 3 (8): 1445–1450. doi:10.2514/3.3166. http://pdf.aiaa.org/getfile.cfm?urlX=7%3CWIG7D%2FQKU%3E6B5%3AKF2Z%5CD%3A%2B82%2A%40%24%5E%3F%40%20%0A&urla=%25%2ARL%2F%220L%20%0A&urlb=%21%2A%20%20%20%0A&urlc=%21%2A0%20%20%0A&urld=%21%2A0%20%20%0A&urle=%27%2BB%2C%27%22%20%22KT0%20%20%0A. 
  6. ^ Bryson, A. E.; Frazier, M. (1963). Smoothing for linear and nonlinear systems. pp. 353-364. 
  7. ^ Bierman, G.J. (1973). “Fixed interval smoothing with discrete measurements”. International Journal of Control 8: 65-75.