汎函数微分

数学および理論物理学における汎函数微分（はんかんすうびぶん、英: functional derivative）は方向微分の一般化である。方向微分が有限次元のベクトルに関する微分法であるのに対して、汎函数微分は（無限次元ベクトルとしての）連続函数に対する微分法を与えるとされるが、単純な一変数微分積分学における一次元の微分を一般化したものと見做せる点では両者は共通している。汎函数微分の数学的に厳密な取扱いは函数解析学に属する。

定義[編集]

与えられた多様体 M が (連続な/滑らかな/ある種の境界条件を持つなどの) 函数 φ を表現するものとし、汎函数 F が

F\colon M\to \mathbb {R} \quad {\mbox{or}}\quad F\colon M\to \mathbb {C}

と定義されているとき、F の汎函数微分 δF⁄δφ とは、任意の試験函数 f に対して

{\begin{aligned}\left\langle {\frac {\delta F[\varphi (x)]}{\delta \varphi (x)}},f(x)\right\rangle &=\int {\frac {\delta F[\varphi (x)]}{\delta \varphi (x')}}f(x')dx'\\[5pt]&=\lim _{\varepsilon \to 0}{\frac {F[\varphi (x)+\varepsilon f(x)]-F[\varphi (x)]}{\varepsilon }}\\[5pt]&=\left.{\frac {d}{d\varepsilon }}F[\varphi +\varepsilon f]\right|_{\epsilon =0}\end{aligned}}

を満たすようなシュヴァルツ超函数を言う。試験函数 f のところに φ の第一変分 δφ を代用して、汎函数 F の第一変分 δF が得られることは、傾き (gradient) から函数の微分が得られるのと同様である。また、ノルム 1 の試験函数 f を用いれば、この函数に沿った方向微分が得られる。

物理学では、（偏微分が傾きの成分であるのと同様の意味で、ひとつの汎函数微分の各「成分」を記述する）点 y における汎函数微分を導くのに、一般の試験函数 f(x) ではなくてディラックのデルタ函数 δ(x − y) を用いて

{\frac {\delta F[\varphi (x)]}{\delta \varphi (y)}}=\lim _{\varepsilon \to 0}{\frac {F[\varphi (x)+\varepsilon \delta (x-y)]-F[\varphi (x)]}{\varepsilon }}

とするのが普通である。この手法は、F[φ(x) + εf(x)] が形式的に ε を変数とする級数に（あるいは少なくとも一次までは）展開できる場合にはうまくいく。しかしこの式は数学的に言えば厳密なものでない、なぜなら F[φ(x) + εδ(x − y)] はふつう十分に定義されないからである。

厳密な扱い[編集]

汎函数微分の定義は、考える函数の空間をもっときちんと定めれば、もっと数学的に明確で厳密に扱うことができる。例えば、考える函数空間がバナッハ空間のとき汎函数微分はフレシェ微分として知られるものになるし、もっと一般の局所凸空間でもガトー微分ができる。よく用いられるヒルベルト空間もバナッハ空間の特別の場合なのであった。このようなより厳密な取扱いをすることにより、通常の微分積分学や解析学における様々な定理が、函数解析学における（函数解析学に特有の新たな定理と並ぶ）相応の定理へと一般化される。

試験函数にデルタ函数を用いること[編集]

先の定義は任意の試験函数 f に対して満足される関係式に基づいて与えられたものだったから、試験函数を特別の函数に限ったとしてもその関係式が満たされるはずだが、しかし選んだ函数がディラックデルタのようなものであるとすれば、それは試験函数として有効なものではない。

定義は、汎函数微分が変動函数 φ(x) の小さな摂動に対して汎函数 F[φ(x)] の摂動がどの程度であるかを記述するものであることを言っているのであって、φ(x) における摂動が特定の形であることを規定するものではないけれども、x が定義される全区間の上で引き延ばすようなものでなければいけない。摂動の形をデルタ函数で与えられるものに限るということは、変動函数 φ(x) が決められた点 y においてのみ変化することを意味するのであり、この点を除いては φ(x) は変動しない。

物理学で、ある量（例えば、位置 r₁ における電位 V）の、別の量（例えば、位置 r₂ における電荷密度 ρ）を変化させた時の影響がどのようなものになるかを知りたいという場面はよくある。この与えられた位置における電位は電荷密度の函数、即ち特定の密度函数と空間内の点とが与えられればその点における電荷を意味する数値を密度函数を使って計算することができる。この数値が空間の全ての点を亙ってどのように変化するのかを知りたいのだから、電位を位置 r の函数として

V({\boldsymbol {r}})=F[\rho ]={\frac {1}{4\pi \epsilon _{0}}}\int {\frac {\rho ({\boldsymbol {r}}')}{|{\boldsymbol {r}}-{\boldsymbol {r}}'|}}dr'

と扱う。つまり、各 r に対して、電位 V(r) というのは、ρ(r′) を引数とする汎函数なのである。汎函数微分の定義に照らして、

{\begin{aligned}\left\langle {\frac {\delta F[\rho ]}{\delta \rho ({\boldsymbol {r}}')}},f({\boldsymbol {r}}')\right\rangle &={\frac {d}{d\varepsilon }}\left.{\frac {1}{4\pi \epsilon _{0}}}\int {\frac {\rho ({\boldsymbol {r}}')+\varepsilon f({\boldsymbol {r}}')}{|{\boldsymbol {r}}-{\boldsymbol {r}}'|}}dr'\right|_{\varepsilon =0}\\&={\frac {1}{4\pi \epsilon _{0}}}\int {\frac {f({\boldsymbol {r}}')}{|{\boldsymbol {r}}-{\boldsymbol {r}}'|}}\mathrm {d} r'\\&=\left\langle {\frac {1}{4\pi \epsilon _{0}|{\boldsymbol {r}}-{\boldsymbol {r}}'|}},f({\boldsymbol {r}}')\right\rangle .\end{aligned}}

ゆえに

{\frac {\delta V(r)}{\delta \rho (r')}}={\frac {1}{4\pi \epsilon _{0}|r-r'|}}

が成り立つ。いま、r = r₁ および r′ = r₂ における汎函数微分を評価することができるから、r₁ における電位が、r₂ における電荷密度の小さな変化の影響を受けてどのくらい変わるかを知ることができるが、一般には評価できない形の式のほうが恐らくは有用である。

例[編集]

函数とその導函数を含む式の積分として書けるような、よくあるクラスの汎函数に対して、その汎函数微分に関する公式を挙げる。これはオイラー-ラグランジュ方程式の一般化であり、実際、物理学において汎函数微分は、ラグランジュ力学の最小作用原理から第二種ラグランジュ方程式の導出の中で導入された（18世紀）。以下の最初の三つの例は密度汎函数論（20世紀）から、四番目は統計力学（19世紀）からのものである。

函数とその導函数の混じった式[編集]

与えられた汎函数が

F[\rho ({\boldsymbol {r}})]=\int f({\boldsymbol {r}},\rho ({\boldsymbol {r}}),\nabla \rho ({\boldsymbol {r}}))\,d{\boldsymbol {r}}

なる形で、ρ が r の境界で消えるものとすると、汎函数微分と試験函数 φ との内積は

{\begin{aligned}\left\langle {\frac {\delta F[\rho ]}{\delta \rho }},\phi \right\rangle &={\frac {d}{d\varepsilon }}\left.\int f({\boldsymbol {r}},\rho +\varepsilon \phi ,\nabla \rho +\varepsilon \nabla \phi )\,d{\boldsymbol {r}}\right|_{\varepsilon =0}\\[5pt]&=\int \left({\frac {\partial f}{\partial \rho }}\phi +{\frac {\partial f}{\partial \nabla \rho }}\cdot \nabla \phi \right)d{\boldsymbol {r}}\\[5pt]&=\int \left[{\frac {\partial f}{\partial \rho }}\phi +\nabla \cdot \left({\frac {\partial f}{\partial \nabla \rho }}\phi \right)-\left(\nabla \cdot {\frac {\partial f}{\partial \nabla \rho }}\right)\phi \right]d{\boldsymbol {r}}\\[5pt]&=\int \left[{\frac {\partial f}{\partial \rho }}\phi -\left(\nabla \cdot {\frac {\partial f}{\partial \nabla \rho }}\right)\phi \right]d{\boldsymbol {r}}\\[5pt]&=\left\langle {\frac {\partial f}{\partial \rho }}-\nabla \cdot {\frac {\partial f}{\partial \nabla \rho }}\,,\phi \right\rangle ,\end{aligned}}

なる形に書くことができる。ここで、三行目は積分の限界において φ = 0 と仮定した。故に汎函数微分は

{\frac {\delta F[\rho ]}{\delta \rho }}={\frac {\partial f}{\partial \rho }}-\nabla \cdot {\frac {\partial f}{\partial \nabla \rho }}

あるいはより明示的に書けば

{\frac {\delta F[\rho ({\boldsymbol {r}})]}{\delta \rho ({\boldsymbol {r}})}}={\frac {\partial }{\partial \rho ({\boldsymbol {r}})}}f({\boldsymbol {r}},\rho ({\boldsymbol {r}}),\nabla \rho ({\boldsymbol {r}}))-\nabla \cdot {\frac {\partial }{\partial \nabla \rho ({\boldsymbol {r}})}}f({\boldsymbol {r}},\rho ({\boldsymbol {r}}),\nabla \rho ({\boldsymbol {r}}))

となる。この例は考える汎函数が、函数 ρ(r) とその勾配 ∇ρ(r) のみに依存するという特別な場合を示している。より一般には、汎函数は高次の導函数を含む

F[\rho ({\boldsymbol {r}})]=\int f({\boldsymbol {r}},\rho ({\boldsymbol {r}}),\nabla \rho ({\boldsymbol {r}}),\nabla ^{2}\rho ({\boldsymbol {r}}),\dots ,\nabla ^{N}\rho ({\boldsymbol {r}}))\,d{\boldsymbol {r}}

なる形も想定しなければならない。ここで ∇ⁱ は各第 nⁱ-成分が何れも i-階偏微分作用素、つまり

\partial ^{i}/(\partial r_{1}^{i_{1}}\,\partial r_{2}^{i_{2}}\dots \partial r_{n}^{i_{n}})\quad (i_{1}+i_{2}+\cdots +i_{n}=i)

であるようなテンソルとする。この場合も先ほどと同様に、定義から

{\begin{aligned}{\frac {\delta F[\rho ]}{\delta \rho }}&={\frac {\partial f}{\partial \rho }}-\nabla \cdot {\frac {\partial f}{\partial (\nabla \rho )}}+\nabla ^{2}\cdot {\frac {\partial f}{\partial \left(\nabla ^{2}\rho \right)}}+\dots +(-1)^{N}\nabla ^{N}\cdot {\frac {\partial f}{\partial \left(\nabla ^{N}\rho \right)}}\\&=\sum _{i=0}^{N}(-1)^{i}\nabla ^{i}\cdot {\frac {\partial f}{\partial \left(\nabla ^{i}\rho \right)}}\end{aligned}}

となることが導かれる。

トーマス＝フェルミ運動エネルギー汎函数[編集]

1927年のトーマス＝フェルミ模型では、電子構造の密度汎函数論の最初の試みにおいて、非干渉一様電子ガスに対する運動エネルギー汎函数

T_{\mathrm {TF} }[\rho ]=C_{\mathrm {F} }\int \rho ^{5/3}({\boldsymbol {r}})\,d{\boldsymbol {r}}

が用いられた。T_TF[ρ] は電荷密度 ρ(r) にのみ依存して、その勾配やラプラシアンあるいは他の高階微分には依存しない（このような汎函数は「局所的」であるという）。従って

{\frac {\delta T_{\mathrm {TF} }[\rho ]}{\delta \rho }}=C_{\mathrm {F} }{\frac {\partial \rho ^{5/3}({\boldsymbol {r}})}{\partial \rho ({\boldsymbol {r}})}}={\frac {5}{3}}C_{\mathrm {F} }\rho ^{2/3}({\boldsymbol {r}})

が成り立つ。

クーロン位置エネルギー汎函数[編集]

電位の古典的な部分に対して、トマスとフェルミはクーロン位置エネルギー汎函数

J[\rho ]={\frac {1}{2}}\iint {\frac {\rho ({\boldsymbol {r}})\rho ({\boldsymbol {r}}')}{\vert {\boldsymbol {r}}-{\boldsymbol {r}}'\vert }}\,d{\boldsymbol {r}}d{\boldsymbol {r}}'=\int \left({\frac {1}{2}}\int {\frac {\rho ({\boldsymbol {r}})\rho ({\boldsymbol {r}}')}{\vert {\boldsymbol {r}}-{\boldsymbol {r}}'\vert }}d{\boldsymbol {r}}'\right)d{\boldsymbol {r}}=\int j[{\boldsymbol {r}},\rho ({\boldsymbol {r}})]\,d{\boldsymbol {r}}

を採用した。やはり J[ρ] は電荷密度 ρ のみに依存して、その各種高階導函数に依存しない（つまり局所的汎函数である）から

{\frac {\delta J[\rho ]}{\delta \rho ({\boldsymbol {r}})}}={\frac {\partial j}{\partial \rho ({\boldsymbol {r}})}}={\frac {1}{2}}\int {\frac {\partial }{\partial \rho ({\boldsymbol {r}})}}{\frac {\rho ({\boldsymbol {r}})\rho ({\boldsymbol {r}}')}{\vert {\boldsymbol {r}}-{\boldsymbol {r}}'\vert }}\,d{\boldsymbol {r}}'=\int {\frac {\rho ({\boldsymbol {r}}')}{\vert {\boldsymbol {r}}-{\boldsymbol {r}}'\vert }}\,d{\boldsymbol {r}}'

が得られる。クーロン位置エネルギー汎函数の二階汎函数微分は

{\frac {\delta ^{2}J[\rho ]}{\delta \rho ({\boldsymbol {r}}')\delta \rho ({\boldsymbol {r}})}}={\frac {\partial }{\partial \rho ({\boldsymbol {r}}')}}{\frac {\rho ({\boldsymbol {r}}')}{\vert {\boldsymbol {r}}-{\boldsymbol {r}}'\vert }}={\frac {1}{\vert {\boldsymbol {r}}-{\boldsymbol {r}}'\vert }}

となる。

ヴァイツゼッカー運動エネルギー汎函数[編集]

1935年にフォン・ヴァイツゼッカーは、分子の電子雲についてより適切になるように、トマス-フェルミ運動エネルギー汎函数に勾配を加味して修正した

T_{\mathrm {W} }[\rho ]={\frac {1}{8}}\int {\frac {\nabla \rho ({\boldsymbol {r}})\cdot \nabla \rho ({\boldsymbol {r}})}{\rho ({\boldsymbol {r}})}}d{\boldsymbol {r}}={\frac {1}{8}}\int {\frac {(\nabla \rho ({\boldsymbol {r}}))^{2}}{\rho ({\boldsymbol {r}})}}\,d{\boldsymbol {r}}=\int t[\rho ({\boldsymbol {r}}),\nabla \rho ({\boldsymbol {r}})]d{\boldsymbol {r}}

を用いることを提唱した。そうすると、この T_W[ρ] は電荷密度 ρ およびその勾配 ∇ρ にも依存するので、

{\begin{aligned}{\frac {\delta T_{\mathrm {W} }[\rho ]}{\delta \rho }}&={\frac {\partial t}{\partial \rho }}-\nabla \cdot {\frac {\partial t}{\partial (\nabla \rho )}}\\&=-{\frac {1}{8}}{\frac {(\nabla \rho ({\boldsymbol {r}}))^{2}}{\rho ({\boldsymbol {r}})^{2}}}-\nabla \cdot \left({\frac {1}{4}}{\frac {\nabla \rho ({\boldsymbol {r}})}{\rho ({\boldsymbol {r}})}}\right)\\&={\frac {1}{8}}{\frac {(\nabla \rho ({\boldsymbol {r}}))^{2}}{\rho ({\boldsymbol {r}})^{2}}}-{\frac {1}{4}}{\frac {\nabla ^{2}\rho ({\boldsymbol {r}})}{\rho ({\boldsymbol {r}})}}\end{aligned}}

となる。

汎函数としての函数[編集]

最終的に、任意の函数は汎函数として表せることを注意しておこう。例えば

\rho ({\boldsymbol {r}})=\int \rho ({\boldsymbol {r}}')\delta ({\boldsymbol {r}}-{\boldsymbol {r}}')\,d{\boldsymbol {r}}'

である。この汎函数は上記最初の二つの例のように ρ にのみ依存（つまり局所的）であるから、

{\frac {\delta \rho ({\boldsymbol {r}})}{\delta \rho ({\boldsymbol {r}}')}}={\frac {\partial \rho ({\boldsymbol {r}}')\delta ({\boldsymbol {r}}-{\boldsymbol {r}}')}{\partial \rho ({\boldsymbol {r}}')}}=\delta ({\boldsymbol {r}}-{\boldsymbol {r}}')

が成り立つ。

エントロピー[編集]

離散確率変数のエントロピーは確率密度函数を引数とする汎函数

{\begin{aligned}H[p(x)]=-\sum _{x}p(x)\log p(x)\end{aligned}}

であり、従って

{\begin{aligned}\left\langle {\frac {\delta H}{\delta p}},\phi \right\rangle &=\sum _{x}{\frac {\delta H[p(x)]}{\delta p(x')}}\,\phi (x')\\&=\left.{\frac {d}{d\epsilon }}H[p(x)+\epsilon \phi (x)]\right|_{\epsilon =0}\\&=-{\frac {d}{d\varepsilon }}\left.\sum _{x}[p(x)+\varepsilon \phi (x)]\log[p(x)+\varepsilon \phi (x)]\right|_{\varepsilon =0}\\&=\displaystyle -\sum _{x}[1+\log p(x)]\phi (x)\\&=\left\langle -[1+\log p(x)],\phi \right\rangle .\end{aligned}}

即ち、

{\frac {\delta H}{\delta p}}=-[1+\log p(x)]

が成り立つ。

指数型汎函数[編集]

汎函数 F を

F[\varphi (x)]=\exp \left(\int \varphi (x)g(x)dx\right)

で与えられるものとする。デルタ函数を試験函数として

{\begin{aligned}{\frac {\delta F[\varphi (x)]}{\delta \varphi (y)}}&=\lim _{\varepsilon \to 0}{\frac {F[\varphi (x)+\varepsilon \delta (x-y)]-F[\varphi (x)]}{\varepsilon }}\\&=\lim _{\varepsilon \to 0}{\frac {\displaystyle \exp \left(\int (\varphi (x)+\varepsilon \delta (x-y))g(x)dx\right)-\exp \left(\int \varphi (x)g(x)dx\right)}{\varepsilon }}\\&=\exp \left(\int \varphi (x)g(x)dx\right)\lim _{\varepsilon \to 0}{\frac {\displaystyle \exp \left(\varepsilon \int \delta (x-y)g(x)dx\right)-1}{\varepsilon }}\\&=\exp \left(\int \varphi (x)g(x)dx\right)\lim _{\varepsilon \to 0}{\frac {\exp \left(\varepsilon g(y)\right)-1}{\varepsilon }}\\&=\exp \left(\int \varphi (x)g(x)dx\right)g(y).\end{aligned}}

となるから、

{\frac {\delta F[\varphi (x)]}{\delta \varphi (y)}}=g(y)F[\varphi (x)]

を得る。

参考文献[編集]

R. G. Parr, W. Yang, “Density-Functional Theory of Atoms and Molecules”, Oxford University Press, Oxford 1989.
B. A. Frigyik, S. Srivastava and M. R. Gupta, Introduction to Functional Derivatives, UWEE Tech Report 2008-0001. http://www.ee.washington.edu/research/guptalab/publications/functionalDerivativesIntroduction.pdf