最適制御
最適制御(さいてきせいぎょ、英: optimal control)の理論は、場合によれば制約条件のもとで、性能の判別値を最小化(もしくは最大化)させるところのひとつの系の制御を決定するのを、可能にする。人はその状態における同じ型の制約条件を検討に加えるがしかし、さらに古典的な(さらに加えて単純な)場合にはその制御における不等式の形の制約条件のものになる。この理論は変分法における一般化のひとつである。それらは二つの面の組み合わせである:
- レフ・ポントリャーギンならびにモスクワのステクロフ研究所の彼の協同者らの最大値(もしくは最小値)の原理[1]
- アメリカのリチャード・ベルマンによって導入された動的計画法の方向から関係する、ハミルトン-ヤコビ方程式の一般化である、ハミルトン-ヤコビ-ベルマン方程式[2]
最適制御の理論はオートメーション工学ならびに応用数学(もしくは処理工程の数理最適化)の一部をなす。変分法の一般化としてのこの理論において、それらは数理物理学における応用のひとつの分野であり、そして純粋数学の合流の現代の理論の進展の結果でもある。
歴史[編集]
最近の研究業績はまず最初に、根本的な修正なしに二つのアプローチの一般化をもつ;それはフランク・H.クラークが導入した一般化された勾配(仏: gradients généralisés)(もしくは一般化された微分〈仏: differentielles généralisés〉)を用いた、この研究者による滑らかでない解析(仏: analyse non lisse)の枠組みにおける微分可能性の制約を弱めた方向を巡る良い部分についてである[3][4][5]。ポントリャーギンと彼の共同者の元の理論における断片の連続関数のもののところよりもより一般の自然な制御におけるふるまいをそれらは持つ:とりわけルベーグ可測関数。別のひとつの門脈の拡張としての遅れを伴った系[6]ならびに無限次元におけるさらなる一般化がある[7]。他方では、特殊な数学のテクニックのこの終わりからの展開をもった後の地味な時期に、ボルチャンスキーは系についての最大値原理のひとつの弱い版の結果をもたらした[8]、けれどもカルーシュ・クーン・タッカー条件から出たその結果の難しさなしに人は証明を与える[9]。凸集合の一定の条件のもとで、系のこのタイプについての真の最大値の原理を人はしかしながら認める[10]。
最大原理と動的計画法:相違と類似[編集]
元来、ポントリャーギンの最大原理は最適性におけるひとつの必要条件である、一方で、動的計画法はひとつの十分条件を提供する。他方では、動的計画法は(系における状態の関数の)ひとつの閉じたループ (仏: boucle)上の制御でふるまうものであるのに、最大原理は(時間の関数の)ひとつの開じたループ上の解として与える。
しかしながら、最大原理の制御の解は、閉じたループにおけるひとつの制御の形から見た適用である、この好都合な場合において、与えられる。しかしながら、動的計画法における最大原理のひとつの大きな利点は、前者そのものが、(問題が<<重端での>>事柄によって、しかしながら酷く複雑であるものである分解の)常微分方程式のその分解であるままの場合に対し、後者が、(ハミルトン-ヤコビ-ベルマン方程式の)偏微分を通した或る方程式の分解を導く、連続な時間でのその系にそれらが適用される場合に、仕事での簡単さをさらに大きく付け加えることである。
動的計画法それ自体は確率的な系におけることと同じく決定的な系にも同じ程度に適用される。[2][11]しかしながら最大原理は(少しの例外をもって[12])決定論の場合のようには適用できない。
最適制御のための数値的方法[編集]
最適制御問題は一般的には非線形であり、したがって、線形二次最適制御問題のような解析的な解をもたない、結果として、最適制御問題を解くような数値的方法を採用することが必要である。
間接法[編集]
およそ1950年代から1980年代までの最適制御の初期の年代では最適制御問題についてのもてはやされたアプローチは間接法(英: indirect method)だった。間接法では、その変分法は一次の最適条件を満たすよう採用される。これらの条件は二点(もしくは多点の、複合問題の場合)における境界値問題の結果を与える。この境界値問題はハミルトニアンの微分をとることから実際には特殊な構造を有する。このようにして、力学系の結果は次の形のハミルトン系である。
ここに
は独立変数ハミルトニアン(英: argumented Hamiltonian)であって、間接法においては、境界値問題は適切な境界もしくは横断的な条件(英: transversality condition)を用いて解かれる。間接法を使うことの美しさは、状態ベクトルならびに随伴ベクトル(たとえば)が求める解とそれについての極軌道にたいして前もって確実に解けることである。間接法の欠点は(特に、時間間隔が長い問題や内点の制約条件のある問題について)その境界値問題を解くことがしばしば極端に難しくなることである。間接法を実装した有名なソフトウェア・プログラムはBNDSCO である。[13]
直接法[編集]
(たとえば、1980年代から現在までの)過去20年間における数値的な最適制御での峻峰へ登頂するアプローチは直接法(英: direct method)と呼ばれるものの事である。直接法では、その状態ならびに/や制御は(たとえば、多項式近似(英: polynomial approximation)もしくは区分折線近似(英: piecewise constant parameterization)での)適当な関数近似を用いて近似される。同時に色々に使える費用は費用関数 (英: cost function)として近似される。それ故、関数近似の係数は最適化の変数として扱われる、そして問題は次の形の非線形の最適化問題へと「書き直される」:
を最小化、ただしここで代数的制約:
を条件とする
非線形最適化問題の規模は(たとえば、直接ねらい撃ちするか、準線形の方法のようにして)極めで小さくできるか、(たとえば、擬スペクトル的最適制御[14]のようにして)緩和されるか、もしくは(たとえば、直接選点法のように[15])極めて大きくなるかもしれない、採用した直接法の類型に依存する。後者の場合(例えば、選点法)、非線形最適化問題は文字通り千から十万の変数と制約条件になる。直接法から起こる、与えられる規模の大きさは、境界要素法を解くことよりも非線形最適化問題を解くことが易しいという、直観に多少反して現れるかもしれない。それは、しかしながら、境界要素法よりも非線形最適化問題(NLP)の方が解くことが易しいという事実である。計算の相対的な容易さについての理由、特に直接選点法は、NLPが疎ら(まばら、英: sparse)であり、大規模なNLPを解くような多くの良く知られたソフトウェア・プログラム(例えば、SNOP[16])が存在する、事である。結果として、(特に最近極めて普及したものである直接「選点法」の)直接法を通して解き得るものの問題の適用範囲は、間接法を通して解き得るものである問題の適用範囲よりも著しく大きい。
直接法のソフトウェア[編集]
事実として、直接法は最近それ程普及するようになったので、多くの人々はこれらの解法を採用する改善されたソフトウェアを書くようになった。特に、多くのプログラムの中にはDIRCOL、SOCS、OTIS、GESOP/ASTOS[17]、DITAN、PyGMO/PyKEPが含まれる。近年MATLABプログラミング言語の到来に従い、産業開発用MATLABツールの一例としてPROPT[18]が在る折に、RIOTS、DIDO[19]、DIRECT、GPOPSを含む直接法を実装するMATLABソフトウェアツールでの最適制御ソフトウェア。これらのソフトウェア・ツールは学術研究、ならびに産業問題の両方についての複雑な最適制御問題を人々が探求するような機会を著しく増やした。結果として、CやFORTRANで既に可能であったよりも、著しく簡単にTOMLABのような汎用のMATLAB最適化環境で複雑な最適制御問題のコーディングをするようになった、ことは注目される。
関連項目[編集]
- APMonitor(英語: APMonitor)(PythonとMATLABのための動的最適化用プラットフォーム)
- DIDO (ソフトウェア)(英語: DIDO (software))
- DNSS point(英語: DNSS point)
- GPOPS-II(英語: GPOPS-II)
- H∞制御理論
- JModelica.org(英語: JModelica.org)(動的最適化のためのModelicaベースのオープン・ソースのプラットフォーム)
- PROPT(英語: PROPT)(MATLABのための最適制御ソフトウェア)
- SNOPT(英語: SNOPT)
- ガウス擬スペクトル法(英語: Gauss pseudospectral method)
- ガウス線形二次制御(フランス語: commande LQG)
- 滑動状態制御(英語: sliding mode control)
- カルマンフィルター
- 擬スペクトル的最適制御(英語: pseudospectral optimal control)
- 軌道最適化(英語: trajectory optimization)
- 最速降下曲線
- 自由エネルギー原理(英語: free energy principle)
- 状態帰還制御(フランス語: commande par retour d'état)
- 線形二次整流器(英語: linear-quadratic regulator)
- 追跡-回避(英語: pursuit-evasion)ゲーム
- 動的計画法
- 汎用濾波器(英語: Generalized filtering)
- 非決定論的制御(英語: Stochastic control)
- ベルマン方程式
- ベルマン擬スペクトル法(英語: Bellman pseudospectral method)
- 変分法
- 模型予測制御(英語: model predictive control)
脚注[編集]
- ^ Pontryagin et al. (1962).
- ^ a b Bellman (1957).
- ^ Clarke (1976).
- ^ Clarke (1987).
- ^ Vinter (2000).
- ^ Gorecki, Fuksa & Korytowski (1989).
- ^ Li & Yong (1994).
- ^ Boltyanskii (1976).
- ^ Bourlès (2004).
- ^ Neustadt (1976), ssVII.4.
- ^ Fleming & Rishel (1975).
- ^ Haussmann (1978).
- ^ Oberle & Grmm (1989).
- ^ Ross & Karpenko (2012).
- ^ Betts (2010).
- ^ Gill, Murray & Saunders (2007).
- ^ Gash & Well (2001).
- ^ Rutquist & Edvall.
- ^ Ross & Fahroo (2002).
参考文献[編集]
論文[編集]
- Clarke, Frank H. (1976). “The maximum Principle under Minimal Hypotheses”. SIAM J. Control Optim. 14 (6): 1078-1091.
- Haussmann, V. G. (1978). “Onthe Stochastic Maximum Principle”. SIAM J. Control and Optimization 16 (2): 236-269.
- Ross, I. M.; Karpenko, M. (2012). “A Review of Pseudospectral Optimal Control: From Theory to Flight”. Annual Reviews in Control 36 (2): 182-197. doi:10.1016/j.arcontrol.2012.09.002.
書籍[編集]
- Bellman, Richard (1957), Princeton University Press, ed., Dynamic Programming, ISBN 0486428095
- Betts, J. T. (2010). Practical Methods for Optimal Control Using Nonlinear Programming (2nd ed.). Philadelphia, Pennsylvania: SIAM Press. ISBN 978-0-89871-688-7
- Boltyanskii, L. S. (1976), Commande optimale des systèmes discrets, Mir, pp. 467
- Bourlès, Henri (2004). “1.La commande optimale des systèmes dynamiques”. In H. AbouKandil (dir.). Principe du maximum. Hermès-Science. pp. 15-70. ISBN 2746209659
- Clarke, Frank H. (1987), Optimization and Nonsmooth Analysis, Society for Industrial & Applied Mathematics, U. S., pp. 360, ISBN 0898712564
- Fleming, Wendell Helms; Rishel, Raymond W. (1975). Deterministic and Stochastic Optimal Control. Springer. p. 320. ISBN 3540901558
- Gorecki, Henrik; Fuksa, Stanislaw; Korytowski, Adam (1989), Analysis and Synthesis of Time Delay Systems, John Wiley & Sons, pp. 382, ISBN 0471276227
- Li, Xunjing; Yong, Jiongmin (1994), Optimal Control Theory for Infinite Dimensional Systems, Birkhäuser, pp. 448, ISBN 0817637222
- Neustadt, Lucien W. (1976), Optimization, A, Theory of Cecessary Conditions, Princeton Univ. Press, pp. 440, ISBN 0691081417
- Oberle, H. J.; Grmm (1989), “BNDSCO - A Program for the Numerical Solution of Optimal Control Problems”, Institute for Flight Systems Dynamics (Oberpfaffenhofen: DLR)
- Pontryagin, L. S.; Boltyanskii, V. G.; Gamkrelidze, R. V.; Mishchenko, E. F. (1962), Interscience, ed., The Mathematical Theory of Optimal Processes, ISBN 2881240771からの翻訳の
最適制御の数学的理論. 文一総合出版. (1967-05). ISBN 978-4829920701 - Vinter, Richard (2000), Optimal Control, Birkhäuser, ISBN 0817640754
ソフトウェア関連[編集]
- Gash, P. F.; Well, K. H. (2001), Trajectory Optimization Using a Combination of Direct Multiple Shoooting and Collocation, Montréal, québec, Canada 6-9 August 2001AIAA 2001-4047, AIAA Guidance, Navigation, and Control Conference
- Gill, P. E.; Murray, W. M; Saunders, M. A. (2007-04-24), “User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming”, University of California, San Diego Report
- Ross, I. M.; Fahroo, F. (2002), “User's Manual for DIDO: A MATLAB Package for Dynamic Optimization”, Naval Postgraduate School Technical Report
- Rutquist, P.; Edvall, M. M., PROPT - MATLAB Optimal Control Software, 1260 S. E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.