最適制御

最適制御（さいてきせいぎょ、英: optimal control）の理論は、場合によれば制約条件のもとで、性能の判別値を最小化（もしくは最大化）させるところのひとつの系の制御を決定するのを、可能にする。人はその状態における同じ型の制約条件を検討に加えるがしかし、さらに古典的な（さらに加えて単純な）場合にはその制御における不等式の形の制約条件のものになる。この理論は変分法における一般化のひとつである。それらは二つの面の組み合わせである：

レフ・ポントリャーギンならびにモスクワのステクロフ研究所の彼の協同者らの最大値（もしくは最小値）の原理^[1]
アメリカのリチャード・ベルマンによって導入された動的計画法の方向から関係する、ハミルトン-ヤコビ方程式の一般化である、ハミルトン-ヤコビ-ベルマン方程式^[2]

最適制御の理論はオートメーション工学（フランス語版）ならびに応用数学（もしくは処理工程の数理最適化）の一部をなす。変分法の一般化としてのこの理論において、それらは数理物理学における応用のひとつの分野であり、そして純粋数学の合流の現代の理論の進展の結果でもある。

歴史[編集]

最近の研究業績はまず最初に、根本的な修正なしに二つのアプローチの一般化をもつ；それはフランク・H.クラークが導入した一般化された勾配（仏: gradients généralisés）（もしくは一般化された微分〈仏: differentielles généralisés〉）を用いた、この研究者による滑らかでない解析（仏: analyse non lisse）の枠組みにおける微分可能性の制約を弱めた方向を巡る良い部分についてである^[3]^[4]^[5]。ポントリャーギンと彼の共同者の元の理論における断片の連続関数のもののところよりもより一般の自然な制御におけるふるまいをそれらは持つ：とりわけルベーグ可測関数。別のひとつの門脈の拡張としての遅れを伴った系^[6]ならびに無限次元におけるさらなる一般化がある^[7]。他方では、特殊な数学のテクニックのこの終わりからの展開をもった後の地味な時期に、ボルチャンスキーは系についての最大値原理のひとつの弱い版の結果をもたらした^[8]、けれどもカルーシュ・クーン・タッカー条件から出たその結果の難しさなしに人は証明を与える^[9]。凸集合の一定の条件のもとで、系のこのタイプについての真の最大値の原理を人はしかしながら認める^[10]。

最大原理と動的計画法：相違と類似[編集]

元来、ポントリャーギンの最大原理は最適性におけるひとつの必要条件である、一方で、動的計画法はひとつの十分条件を提供する。他方では、動的計画法は（系における状態の関数の）ひとつの閉じたループ　（フランス語版）（仏: boucle）上の制御でふるまうものであるのに、最大原理は（時間の関数の）ひとつの開じたループ上の解として与える。

しかしながら、最大原理の制御の解は、閉じたループにおけるひとつの制御の形から見た適用である、この好都合な場合において、与えられる。しかしながら、動的計画法における最大原理のひとつの大きな利点は、前者そのものが、（問題が<<重端での>>事柄によって、しかしながら酷く複雑であるものである分解の）常微分方程式のその分解であるままの場合に対し、後者が、（ハミルトン-ヤコビ-ベルマン方程式の）偏微分を通した或る方程式の分解を導く、連続な時間でのその系にそれらが適用される場合に、仕事での簡単さをさらに大きく付け加えることである。

動的計画法それ自体は確率的な系におけることと同じく決定的な系にも同じ程度に適用される。^[2]^[11]しかしながら最大原理は（少しの例外をもって^[12]）決定論の場合のようには適用できない。

最適制御のための数値的方法[編集]

最適制御問題は一般的には非線形であり、したがって、線形二次最適制御問題（英語版）のような解析的な解をもたない、結果として、最適制御問題を解くような数値的方法を採用することが必要である。

間接法[編集]

およそ1950年代から1980年代までの最適制御の初期の年代では最適制御問題についてのもてはやされたアプローチは間接法（英: indirect method）だった。間接法では、その変分法は一次の最適条件を満たすよう採用される。これらの条件は二点（もしくは多点の、複合問題の場合）における境界値問題の結果を与える。この境界値問題はハミルトニアン（英語版）の微分をとることから実際には特殊な構造を有する。このようにして、力学系の結果は次の形のハミルトン系（英語版）である。

{\begin{array}{lcl}{\dot {\textbf {x}}}&=&{\frac {\partial H}{\partial {\boldsymbol {\lambda }}}}\\{\dot {\boldsymbol {\lambda }}}&=&-{\frac {\partial H}{\partial {\textbf {x}}}}\end{array}}

ここに

H={\mathcal {L}}+{\boldsymbol {\lambda }}^{\mathsf {T}}{\textbf {a}}-{\boldsymbol {\mu }}^{\mathsf {T}}{\textbf {b}}

は独立変数ハミルトニアン（英: argumented Hamiltonian）であって、間接法においては、境界値問題は適切な境界もしくは横断的な条件（英: transversality condition）を用いて解かれる。間接法を使うことの美しさは、状態ベクトルならびに随伴ベクトル（たとえば ${\boldsymbol {\lambda }}$ ）が求める解とそれについての極軌道にたいして前もって確実に解けることである。間接法の欠点は（特に、時間間隔が長い問題や内点の制約条件のある問題について）その境界値問題を解くことがしばしば極端に難しくなることである。間接法を実装した有名なソフトウェア・プログラムはBNDSCO である。^[13]

直接法[編集]

（たとえば、1980年代から現在までの）過去20年間における数値的な最適制御での峻峰へ登頂するアプローチは直接法（英: direct method）と呼ばれるものの事である。直接法では、その状態ならびに／や制御は（たとえば、多項式近似（英語版）（英: polynomial approximation）もしくは区分折線近似（英語版）（英: piecewise constant parameterization）での）適当な関数近似（英語版）を用いて近似される。同時に色々に使える費用は費用関数 （英: cost function）として近似される。それ故、関数近似の係数は最適化の変数として扱われる、そして問題は次の形の非線形の最適化問題へと「書き直される」：

F({\textbf {z}}),

を最小化、ただしここで代数的制約： ${\begin{array}{lcl}{\textbf {g}}({\textbf {z}})&=&{\textbf {0}}\\{\textbf {h}}({\textbf {z}})&\leq &{\textbf {0}}\end{array}}$

を条件とする

非線形最適化問題の規模は（たとえば、直接ねらい撃ちするか、準線形の方法のようにして）極めで小さくできるか、（たとえば、擬スペクトル的最適制御（英語版）^[14]のようにして）緩和されるか、もしくは（たとえば、直接選点法のように^[15]）極めて大きくなるかもしれない、採用した直接法の類型に依存する。後者の場合（例えば、選点法）、非線形最適化問題は文字通り千から十万の変数と制約条件になる。直接法から起こる、与えられる規模の大きさは、境界要素法を解くことよりも非線形最適化問題を解くことが易しいという、直観に多少反して現れるかもしれない。それは、しかしながら、境界要素法よりも非線形最適化問題（NLP）の方が解くことが易しいという事実である。計算の相対的な容易さについての理由、特に直接選点法は、NLPが疎ら（まばら、英: sparse）であり、大規模なNLPを解くような多くの良く知られたソフトウェア・プログラム（例えば、SNOP（英語版）^[16]）が存在する、事である。結果として、（特に最近極めて普及したものである直接「選点法」の）直接法を通して解き得るものの問題の適用範囲は、間接法を通して解き得るものである問題の適用範囲よりも著しく大きい。

直接法のソフトウェア[編集]

事実として、直接法は最近それ程普及するようになったので、多くの人々はこれらの解法を採用する改善されたソフトウェアを書くようになった。特に、多くのプログラムの中にはDIRCOL、SOCS、OTIS、GESOP/ASTOS（英語版）^[17]、DITAN、PyGMO/PyKEPが含まれる。近年MATLABプログラミング言語の到来に従い、産業開発用MATLABツールの一例としてPROPT（英語版）^[18]が在る折に、RIOTS、DIDO（英語版）^[19]、DIRECT、GPOPSを含む直接法を実装するMATLABソフトウェアツールでの最適制御ソフトウェア。これらのソフトウェア・ツールは学術研究、ならびに産業問題の両方についての複雑な最適制御問題を人々が探求するような機会を著しく増やした。結果として、CやFORTRANで既に可能であったよりも、著しく簡単にTOMLAB（英語版）のような汎用のMATLAB最適化環境で複雑な最適制御問題のコーディングをするようになった、ことは注目される。

脚注[編集]

[脚注の使い方]

参考文献[編集]

論文[編集]

Clarke, Frank H. (1976). “The maximum Principle under Minimal Hypotheses”. SIAM J. Control Opｔim. 14 (6): 1078-1091.
Haussmann, V. G. (1978). “Onthe Stochastic Maximum Principle”. SIAM J. Control and Optimization 16 (2): 236-269.
Ross, I. M.; Karpenko, M. (2012). “A Review of Pseudospectral Optimal Control: From Theory to Flight”. Annual Reviews in Control 36 (2): 182-197. doi:10.1016/j.arcontrol.2012.09.002.

書籍[編集]

Bellman, Richard (1957), Princeton University Press, ed., Dynamic Programming, ISBN 0486428095
Betts, J. T. (2010). Practical Methods for Optimal Control Using Nonlinear Programming (2nd ed.). Philadelphia, Pennsylvania: SIAM Press. ISBN 978-0-89871-688-7
Boltyanskii, L. S. (1976), Commande optimale des systèmes discrets, Mir, pp. 467
Bourlès, Henri (2004). “1.La commande optimale des systèmes dynamiques”. In H. AbouKandil (dir.). Principe du maximum. Hermès-Science. pp. 15-70. ISBN 2746209659
Clarke, Frank H. (1987), Optimization and Nonsmooth Analysis, Society for Industrial & Applied Mathematics, U. S., pp. 360, ISBN 0898712564
Fleming, Wendell Helms; Rishel, Raymond W. (1975). Deterministic and Stochastic Optimal Control. Springer. p. 320. ISBN 3540901558
Gorecki, Henrik; Fuksa, Stanislaw; Korytowski, Adam (1989), Analysis and Synthesis of Time Delay Systems, John Wiley & Sons, pp. 382, ISBN 0471276227
Li, Xunjing; Yong, Jiongmin (1994), Optimal Control Theory for Infinite Dimensional Systems, Birkhäuser, pp. 448, ISBN 0817637222
Neustadt, Lucien W. (1976), Optimization, A, Theory of Cecessary Conditions, Princeton Univ. Press, pp. 440, ISBN 0691081417
Oberle, H. J.; Grmm (1989), “BNDSCO - A Program for the Numerical Solution of Optimal Control Problems”, Institute for Flight Systems Dynamics (Oberpfaffenhofen: DLR)
Pontryagin, L. S.; Boltyanskii, V. G.; Gamkrelidze, R. V.; Mishchenko, E. F. (1962), Interscience, ed., The Mathematical Theory of Optimal Processes, ISBN 2881240771 からの翻訳の
最適制御の数学的理論. 文一総合出版. (1967-05). ISBN 978-4829920701
Vinter, Richard (2000), Optimal Control, Birkhäuser, ISBN 0817640754
Alfio Borzi (2023), The Sequential Quadratic Hamiltonian Method, Routledge (CRC Press), ISBN 978-0-367715526

ソフトウェア関連[編集]

Gash, P. F.; Well, K. H. (2001), Trajectory Optimization Using a Combination of Direct Multiple Shoooting and Collocation, Montréal, québec, Canada 6-9 August 2001AIAA 2001-4047, AIAA Guidance, Navigation, and Control Conference
Gill, P. E.; Murray, W. M; Saunders, M. A. (2007-04-24), “User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming”, University of California, San Diego Report
Ross, I. M.; Fahroo, F. (2002), “User's Manual for DIDO: A MATLAB Package for Dynamic Optimization”, Naval Postgraduate School Technical Report
Rutquist, P.; Edvall, M. M., PROPT - MATLAB Optimal Control Software, 1260 S. E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.

外部リンク[編集]

この項目は、応用数学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています。

[FOOTNOTEPontryaginBoltyanskiiGamkrelidzeMishchenko1962-1] Pontryagin et al. (1962).

[FOOTNOTEBellman1957-2] Bellman (1957).

[FOOTNOTEClarke1976-3] Clarke (1976).

[FOOTNOTEClarke1987-4] Clarke (1987).

[FOOTNOTEVinter2000-5] Vinter (2000).

[FOOTNOTEGoreckiFuksaKorytowski1989-6] Gorecki, Fuksa & Korytowski (1989).

[FOOTNOTELiYong1994-7] Li & Yong (1994).

[FOOTNOTEBoltyanskii1976-8] Boltyanskii (1976).

[FOOTNOTEBourlès2004-9] Bourlès (2004).

[FOOTNOTENeustadt1976ssVII.4-10] Neustadt (1976), ssVII.4.

[FOOTNOTEFlemingRishel1975-11] Fleming & Rishel (1975).

[FOOTNOTEHaussmann1978-12] Haussmann (1978).

[FOOTNOTEOberleGrmm1989-13] Oberle & Grmm (1989).

[FOOTNOTERossKarpenko2012-14] Ross & Karpenko (2012).

[FOOTNOTEBetts2010-15] Betts (2010).

[FOOTNOTEGillMurraySaunders2007-16] Gill, Murray & Saunders (2007).

[FOOTNOTEGashWell2001-17] Gash & Well (2001).

[FOOTNOTERutquistEdvall-18] Rutquist & Edvall.

[FOOTNOTERossFahroo2002-19] Ross & Fahroo (2002).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

表話編歴制御理論
分野	適応制御（英語版）制御理論デジタル制御 en:Energy-shaping control ファジィ制御ハイブリッド制御知能制御（英語版）モデル予測制御（英語版）多変量制御ニューラル制御非線形制御最適制御リアルタイム制御ロバスト制御（英語版）確率制御（英語版）
系特性	ボード線図ブロック図閉ループ伝達関数可制御性（英語版）フーリエ変換周波数特性ラプラス変換ネガティブフィードバック可観測性（英語版）ポジティブフィードバック根軌跡法（英語版）サーボ機構 en:Signal-flow graph 状態空間表現安定性理論定常状態解析・設計システムダイナミクス伝達関数法
デジタル制御	離散時間信号デジタル信号処理量子化（英語版）リアルタイムソフトウェア標本化データシステム同定 Z変換
先進技術	ニューラルネットワーク係数図法（英語版）制御再構成（英語版）分布定数系（英語版）分数次数制御（英語版）ファジィ論理 en:H-infinity loop-shaping ハンケル特異値（英語版）カルマンフィルター en:Krener's theorem 最小二乗法リアプノフ安定 en:Minor loop feedback 知覚制御理論（英語版）状態観測器ベクトル制御
制御器	組み込み制御器閉ループ制御器 en:Lead-lag compensator 数値制御 PID制御プログラマブルロジックコントローラ
制御応用	en:Automation and Remote Control 分散制御システム電動機工業制御システム（英語版）メカトロニクス運動制御（英語版）プロセス制御ロボット工学 SCADA
カテゴリ