凸共役性
数学において凸共役(とつきょうやく、英: convex conjugation)とは、ルジャンドル変換の一般化である。ルジャンドル=フェンシェル変換あるいはフェンシェル変換としても知られる(アドリアン=マリ・ルジャンドルとウェルナー・フェンシェルの名にちなむ)。
定義
[編集]以下、特に断りがなければ、ベクトル空間はすべて実係数のものを考える。
定義 (凸共役性) ― を局所凸位相ベクトル空間(例えば有限次元のベクトル空間)とし、 を の双対空間とし、 を双対組とする。
このとき拡大実数に値を取る函数 の凸共役(英: convex conjugate) は、上限を用いて次のように定義される[1]。
直観的意味
[編集]
上記の定義の直観的な意味を説明するため、ベクトル空間Vの図形の支持超平面を定義する。超平面が集合の支持超平面(英: supporting hyperplane)Πとは、ΠはSの閉包の点を少なくとも1つ含み、しかもをΠで2つ切ったときに片方にはSの点が入っていない事をいう[2]。
凸共役の直観的な意味を考えるため、fのエピグラフ
を考える。
に対しを通るアフィン写像
を考えると、支持超平面の定義から、は上式の「切片」の下限になるはずである。したがって
が成立する。ここで2つ目の等号はエピグラフの定義から従う。
すなわち、におけるの凸共役は「傾き」の支持超平面の「切片」にマイナスをつけたものと解釈できる。
滑らかな場合
[編集]Xが有限次元のベクトル空間で、fが滑らかな凸関数であるとき、傾きの支持超平面を接平面として持つ点をとすると、すなわち
となる点をとすると、fの凸性からそのにおいてが達成されるので、
が成立する。よってこの場合には、凸共役は通常のルジャンドル変換に一致する。
基本的性質
[編集]本節ではXをノルム空間(例えば有限次元の計量ベクトル空間)とし、を関数とする。
前述のように凸共役は直観的には支持超平面によって特徴づけられるが、集合の支持超平面は、の閉包の支持超平面やの凸包の支持超平面と一致するので、以下が成立する:
また凸共役の定義から明らかに次が従う:
上記の不等式を用いると、次が成立する事を簡単に示せる:
定理 ― 任意のに対し、以下が成立する[4]:
一般にはは成立しないが、次節でが成立する条件を説明する。さらに以下が成立する:
二重共役
[編集]本節でもXをノルム空間とする。凸共役を二度取ったは元のに一致する事は保証されない(なお、と違い、は無条件に成立する[5])。しかし以下が成立する事を示せる:
定理 ― がプロパーなら、任意のに対し、以下が成立する[4]:
ここで関数がプロパーであるとは、gが恒等的に∞を取らない事を指す。
は凸関数なので、プロパーな関数がを満たすのはが凸な場合に限られる。そのような関数に対してが成立する条件を具体的に書き表す事で以下が成立する事がわかる:
定理 (フェンシェル=モローの定理) ― プロパーな凸関数が任意のにおいてを満たす必要十分条件は、が下半連続な事である[4]。
上記の定理は各点毎に成立する。すなわち、プロパーな凸関数が点においてを満たす必要十分条件は、がにおいて下半連続な事である[4]。
なお、Xがバナッハ空間であれば凸関数fが下半連続であればの内点で連続である[6]。とくに有限次元のベクトル空間であれば、(下半連続性の仮定がなくとも)の内点で連続である事が示せる[7]。よってこの場合、下半連続性を問われるのは境界点のみである。
また、(バナッハ空間とは限らない)ノルム空間の凸部分集合上定義された凸関数は一点で連続であればその凸部分集合上の全点で連続である事も知られている[6]。
フェンシェルの双対性
[編集]本節では、凸共役を最適化問題に応用するうえで鍵となるフェンシェルの双対性について説明する。
定理のステートメント
[編集]まずは応用について考えず、天下り的に定理を与える。
X、Yをノルム空間とし、を有界線形作用素(例えばX、Yが有限次元の計量ベクトル空間でTが線形写像)とし、さらに、を2つの関数とする。さらに下限pを求める問題と上限dを求める問題
を考える。これらの問題をフェンシェル問題(英: Fenchel problem)[8]といい、後者を前者の(そして前者を後者の)双対問題という。このとき前述したフェンシェル・ヤングの不等式から次が成立する。
さらに次が成立する:
定理 (フェンシェルの双対性定理) ― 記号を上述のように定義するとき、特にX、Yがバナッハ空間(例えば有限次元の計量ベクトル空間)で、、が凸関数で、しかも以下の1, 2のいずれかが成立すれば上式で等号が成立する[10]:
- 、がいずれも下半連続で、しかもが成立する。
さらに上述の等号成立条件を満たし、しかもが有限であれば、上限を達成するが存在する[10]。
ここで集合に対し、
応用
[編集]、を閉凸集合とし、以下の問題を考える:
…問題1
すなわち、、という条件下の最小値を求めよ、という問題である。
上記の問題はフェンチェル問題の特殊な場合とみなす事ができる。実際、集合Aに対し、その指示関数(英: indicator function)を
と定義し、
とすると、問題1はフェンチェル問題に一致する[11]。
したがってpをその双対問題のdで下から抑えたり、等号成立条件が成り立っていれば双対問題の方を具体的に調べる事でを求めたりする事が可能になる。
凸共役の例
[編集]の凸共役は
である。冪函数
の凸共役は
である。ここで である。
絶対値函数
の凸共役は
である。指数函数 の凸共役は
である。指数函数の凸共役とルジャンドル変換は、凸共役の定義域が厳密に大きいことを除いて一致する。ルジャンドル変換は正の実数に対してのみ定義されるためである。
期待ショートフォール(リスク平均値)との関係
[編集]F を確率変数 X の累積分布函数とする。このとき、部分積分により
は次の凸共役を持つ。
順序
[編集]特別な解釈により次の変換が考えられる。
これは初期函数 f の非減少な書き換えである。特に、f に対する は非減少である。
性質
[編集]閉凸函数の凸共役は再び閉凸函数である。多面体的凸函数(多面体的エピグラフを持つ凸函数)の凸共役は、再び多面体的凸函数である。
凸性
[編集]二つの函数 と および数 に対し、次の凸関係が成立する。
この演算 はそれ自身が凸写像である。
極小畳み込み
[編集]二つの函数 f と g の極小畳み込み(infimal convolution)は、次で定義される(epi-sum とも呼ばれる):
f1, …, fm は Rn 上の真凸かつ下半連続な函数とする。このとき、これらの極小畳み込みは凸かつ下半連続である(が、必ずしも真凸ではない)[12]。さらに次が成立する。
二つの函数の極小畳み込みは、次のような幾何学的解釈がある:二つの函数の極小畳み込みの(厳密な)エピグラフは、それらの函数の(厳密な)エピグラフのミンコフスキー和である[13]。
最大化引数
[編集]函数 が微分可能であるなら、その導函数は凸共役の計算における最大化引数(maximizing argument)である。すなわち、
- と
が成り立つ。したがって
であり、さらに次が成立する。
スケーリング性
[編集]ある に対し、 であるなら、次が成り立つ。
さらにパラメータ α が追加される場合は、次が成り立つ。
ここで は最大化引数であるように選ばれる。
線型変換の下での挙動
[編集]A を X から Y への有界線型作用素とする。X 上の任意の凸函数 f に対して、次が成り立つ。
ここで
は f の A に関する原像であり、A* は A の共役作用素である[14]。
閉凸函数 f は、ある与えられた直交線型変換の集合 G に関して対称である、すなわち
であるための必要十分条件は、凸共役 f* が G に関して対称であることである。
代表的な凸共役の表
[編集]次の表では、多くの有名な函数のルジャンドル変換で、有用な性質を持つものが示されている[15]。
| (where ) | |||
| (where ) | |||
| (where ) | (where ) | ||
| (where ) | (where ) | ||
関連項目
[編集]出典
[編集]- ↑ #Ekeland pp.6-7,16
- ↑ “Supporting hyperplane - Encyclopedia of Mathematics”. encyclopediaofmath.org. 2025年1月30日閲覧。
- ↑ Maxim Raginsky. “week 10 notes. The Legendre-Fenchel dual functional and its geometric interpretation”. イリノイ大学. p. 11. 2025年1月30日閲覧。
- 1 2 3 4 5 6 7 8 #Borwein-Luke p.23.
- ↑ #Ekeland p.18
- 1 2 “1. Continuity of convex functions in normed spaces”. ミラノ大学. pp. 1-3. 2025年2月7日閲覧。
- ↑ #Borwein
- ↑ #Borwein-Luke p.25.
- ↑ #Borwein-Luke p.19,25.
- 1 2 #Borwein-Luke p.19,25.
- 1 2 3 #Borwein-Luke p.3.
- ↑ Phelps, Robert (1991). Convex Functions, Monotone Operators and Differentiability (2 ed.). Springer. p. 42. ISBN 0-387-56715-1
- ↑ Bauschke, Heinz H.; Goebel, Rafal; Lucet, Yves; Wang, Xianfu (2008). “The Proximal Average: Basic Theory”. SIAM Journal on Optimization 19 (2): 766. doi:10.1137/070687542.
- ↑ Ioffe, A.D. and Tichomirov, V.M. (1979), Theorie der Extremalaufgaben. Deutscher Verlag der Wissenschaften. Satz 3.4.3
- ↑ #Borwein pp.50-51
参考文献
[編集]- Arnol'd, Vladimir Igorevich (1989). Mathematical Methods of Classical Mechanics (Second ed.). Springer. ISBN 0-387-96890-3. MR 0997295
- Rockafellar, R. Tyrell (1970). Convex Analysis. Princeton: Princeton University Press. ISBN 0-691-01586-4. MR 0274683
- Borwein, Jonathan; Lewis, Adrian (2006). Convex Analysis and Nonlinear Optimization: Theory and Examples (2 ed.). Springer. ISBN 978-0-387-29570-1
- Ivar Ekeland, Roger Témam『Convex Analysis and Variational Problems』Society for Industrial and Applied Mathematics〈Classics in Applied Mathematics, Series Number 28〉、1987年1月1日。ISBN 978-0898714500。
- Jonathan M. Borwein and D. Russell Luke. “Duality and Convex Programming”. ゲッティンゲン大学. 2025年1月30日閲覧。
外部リンク
[編集]- Touchette, Hugo (2005年7月27日). “Legendre-Fenchel transforms in a nutshell” (PDF). 2009年3月6日時点のオリジナルよりアーカイブ。2007年7月24日閲覧。
- Touchette, Hugo (2006年11月21日). “Elements of convex analysis” (PDF). 2008年3月26日閲覧。