ケイリー・ハミルトンの定理

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Jump to navigation Jump to search
王立協会フェローアーサー・ケイリー (1821–1895) は19世紀のブリテンを代表する純粋数学者として広く知られている。ケイリーは1848年にダブリンに赴き、ハミルトンから発見者直々に四元数の講義を受けている。のちにケイリーは、四元数に関する成果を出版する二番目となることによりハミルトンに印象付けた[1]。 ケイリーは三次以下の行列に対して定理を証明したが、二次元の場合に対してだけ証明を発表した[2][3]n × n 行列に対してケイリーは「……、任意次数の行列という一般の場合に定理をきちんと証明する労を引き受ける必要を覚えない。」と述べている。
アイルランドの物理学・天文学・数学者ウィリアム・ローワン・ハミルトン (1805–1865) は米国科学アカデミー初めての外国人会員である。幾何学をいかにして研究すべきかについては対立する位置に立ちながらも、ハミルトンは常にケイリーと最良の関係を留めていた[1] ハミルトンは四元数に関する線型函数に対して、それ自身が満足するある種の方程式の存在を証明した[4][5][6]

線型代数学におけるケイリー・ハミルトンの定理(ケイリー・ハミルトンのていり、: Cayley–Hamilton theorem)、またはハミルトン・ケイリーの定理は(実数体や複素数体などの)可換環上の正方行列固有方程式を満たすという定理である[7]アーサー・ケイリーウィリアム・ローワン・ハミルトンにちなむ。

A が与えられた n×n 行列で、Inn×n 単位行列とすれば、A固有多項式

で定義される[8]。ここで det行列式をとること、λ は係数環の元(スカラー)である。引数の行列は各成分が λ の多項式(とくに一次式または定数)だから、その行列式も λ に関する(n-次の)モニック多項式になる。ケイリー–ハミルトンの定理の主張は、固有多項式を行列多項式と見ればそれが A において消えること、すなわち上記の λ を行列 A で置き換えた結果が零行列に等しいこと: を述べる。

置き換えにおいて、λ の冪は、行列の積に関する累乗としての A の冪によって置き換わるから、特に p(λ) の定数項は A0 すなわち単位行列の定数倍に置き換わらなければならない。

定理により、とくに An はそれより低次の A の冪の線型結合として書き表すことができる。係数環が英語版のとき、ケイリー–ハミルトンの定理は「任意の正方行列 A最小多項式A の固有多項式を整除する(割り切る)」という主張に同値である。

この定理は1853年にハミルトンが初めて証明した[9](それは「非可換」環である四元数を変数とする一次函数の逆を用いたものであった[4][5][6])。これは一般の定理において、実 4 × 4 または複素 2 × 2 という特別の場合にあたるものである。ケイリー–ハミルトンの定理は、四元数係数の行列一般に対しても成立する[10][注 1]。1858年にケイリーは 3 × 3 およびそれより小さい行列に関して定理を述べているが、証明は 2 × 2 の場合のみを著している[2]。一般の場合が初めて証明されたのは1878年でフロベニウスによる[13]

[編集]

1×1[編集]

1×1 行列 A = (a) に対し、その固有多項式は p(λ) := λa であり、p(A) = (a) − aI1 = (0) は明らかである。

2×2[編集]

一般の 2×2 行列を と書けば、固有多項式は p(λ) := λ2 − (a + d)λ + (adbc) で与えられ、ケイリー–ハミルトンの定理の述べるところによれば

が成り立つはずであるが、これは実際に A2 の成分を具体的に書きだせば、確かに成り立っていることが確認できる。

短絡的な「証明」の誤りに関する注意[編集]

この定理を「証明」するのに、単に定義式 λA に置き換えて

(error)

を得るとするのは、一見極めて初等的で簡単なようだが、これは明らかに誤った論法である[14][15]

この論法がダメな理由はいくつもあるが、第一に定理に現れる p(A) は「(n×n の)行列」であるのに対し、上式 error の右辺は行列式の値としての「スカラー」になっているから、(n = 1 でもない限り)それらが等しいと置くことは不当である。第二に、λIn - A に変数 λ は実際には対角成分だけにしか現れない。様子が分かるように具体例として に対する

を見れば、単に λ のところを A で置き換えるというのは明らかに不適当な「行列」を考えていることが理解できるはずである。もちろん、単にスカラーであるところをスカラー行列(単位行列のスカラー倍)で置き換えたブロック行列
を考えるならば式としては有効で、この行列式は実際に 0 になるが、この行列が上記の論法で det の引数とした AIn − A でないことは明らかである。あるいは、行列式が 0 というのもスカラーとして零なのであって、行列である p(A) と比較して等しいかどうかは考えるまでもないという意味でもやはり p(A) = det(AIn − A) = 0 という論法は破綻している。

あるいはまた、この論法が実際に成立していたと仮定した場合、それは行列式以外にもほかの任意の多重線型形式についても成立しないといけないことになる(つまり任意の線型写像は零ベクトルを零ベクトルに写すのだから、AIn − A = O(零行列)は任意の多重線型形式で 0 に写る)。そのような多重線型形式として例えばパーマネント (permanent)英語版[注 2]を使って q(λ) := perm(λ⋅In − A) とすれば、同じ論法で q(A) = 0 が証明されなければならないわけだが、それは見るからに誤りである。実例として 2×2 の場合を書けば、 であるから、 であり、これに A を代入した

は一般には零でない。

ケイリー–ハミルトンの定理の証明の中には、数以外を成分とする行列を用いて、あたかも error 式を用いた論法にある意味似た方法をとるものがあるが、その場合でも AInA と等しくなく、結論も異なる所へ到達する。

応用[編集]

固有多項式の各 i-次の係数は A の固有値たちのなす (n − i)-次基本対称式に等しく、とくに定数項(0 次の係数)は固有値の総乗ゆえそれは A の行列式に等しい。したがって、ケイリー–ハミルトンの定理が保証する等式を

()

の形に書くことができる。ニュートンの公式英語版を用いれば、基本対称式は冪和対称式英語版 で書き表せることに注意すれば、上記の ci は固有値の冪和対称式 sk たちで表されることがわかるが、A の累乗 Akトレースである。したがって、ciAk のトレースで書き表せる。

行列式の計算および逆行列[編集]

一般の n×n 正則行列 A(つまり A の行列式は零でない)に対し、その逆行列 A−1An より小さい次数の多項式表示を持つ。実際、式 () から定数項を移項した の両辺に A−1 を掛ければ

を得る。

一般に、係数 ci を与える公式が、完全指数型ベル多項式によって

と与えられる[注 3]。特に A の行列式は c0 であるから、トレースを含む表示(トレース恒等式英語版)として
と書ける。同様に、
なる表示もできる。

例えば、ベル多項式の最初の方は B0 = 1, B1(x1) = x1, B2(x1, x2) = x 2
1
 
+ x2
, B3(x1, x2, x3) = x 3
1
 
+ 3x1x2 + x3
, … であるから、これらを用いて 2 × 2 の場合の固有多項式の係数 ci を具体的に計算すれば

などとなる。ここで、c0 は行列式であるから、この場合の逆行列を
と計算することができる。

ここで出てきた式 ½((trA)2 − tr(A2)) は、cn−k に対する(ベル多項式を用いた)一般式から出たものだから、n × n 行列に対してもこれは常に λn−2 の係数 cn−2 を与えるものなっていることが一見して分かる。ゆえに特に、3 × 3 行列 A に対するケイリー–ハミルトンの定理の主張を
と書くことができる。同様に n = 3 の場合の行列式は今度は
と書けるが、これはそのまま一般の場合の λn−3 の係数 cn−3 を表す式として理解できる。ゆえにさらにこれを用いて 4 × 4 行列 A に対する定理の主張は
と書けるし、この場合の行列式
cn−4 を表す式に他ならない。以下より大きなサイズの行列に対しても帰納的に同様の話を適用することができる。

係数 ck に対するもっと複雑な表示が、ニュートンの公式英語版ファデーエフ–ルヴェリエのアルゴリズム英語版などから導ける。係数 ck を求める別の方法として、一般の n × n 行列でどの根も 0 でないものと仮定すれば、指数函数を用いた行列式の別表示

を用いたアルゴリズムがある。メルカトル級数英語版を用いて書けば
であるが、p(λ)n-次だから、この指数函数部分は λn のオーダーまで展開するだけでよい。λ の最後の負冪はケイリー–ハミルトンの定理により自動的に消える(再度、これには係数環が有理数体を含むことが必要である)。λ に対する係数たちが完全ベル多項式によって直接的に書けることは、この級数表示とベル多項式の母函数を比べればわかる。この表示を λ に関して微分することで、一般の n に対する固有多項式の一般係数を m × m 行列式
として求めることができる。[注 4]

高次の冪の計算[編集]

ケイリー–ハミルトンの定理は A の冪の間に成り立つ(もっとも単純とは限らないが)関係を記述するものであるから、それにより A の十分大きな指数の冪を含む式の計算において、式を簡単化して A の(n 以上の指数が大きな)冪を直接計算することなく値を評価することができるようになる。

例えば二次の場合に、 とすれば定理より

だから、A4 を計算したければ、順に

のように次数の低い多項式表示に帰着される。同様に

二次の場合には二つの項の和で書けるということが上での計算からわかる。事実として、任意の k-乗がその正方行列のサイズ n に対して次数高々 n − 1 の多項式として書き表せる。これは定理を行列函数の表示に利用できることの一つの実例であり、次の節でより系統的に述べる。

行列函数を多項式に帰着する[編集]

解析函数が収束冪級数として

と与えられ、n × n 行列 A次数 n である固有多項式を p(x) と書くとき、上記の冪級数を十分大きな k で打ち切った多項式に対する剰余付きの除法を考えれば、
で「剰余」多項式 r(x)0 ≤ deg r(x) < n となるような「商」解析函数 q(x) とともに一意的に決まる。x を行列 A に置き換えれば、ケイリー–ハミルトンの定理により p(A) = O だから、ある種の剰余の定理:
が成り立つ。ゆえに、行列変数の解析函数は各行列 A ごとに次数 n 以下の行列多項式として書き表される。

上記除算の剰余を と書けば、A の固有値 λ において評価するとき p(λ) = 0 となるから、各固有値に関して等式

を作ることができる。これは n 本の線型方程式系になっているから、解くことで係数 ci を決定することができて、
が決まる。

固有値が重複を持つ場合、つまり適当な ij に対して λi = λj となるものが存在するとき、上記の方程式系は少なくとも二つの方程式が一致してしまうから、それにより方程式系を一意に解くことができない。そのような場合には、固有値 λ の重複度が m とすれば、p(x)m – 1 階までの導函数がその固有値において消えるから、線型独立な方程式

を新たに m – 1 本追加して、係数ci を決めるのに必要な n 本の方程式系を得ることができる。

全ての点 (λi, f(λi)) を通る多項式を求めることは本質的に補間問題であり、ラグランジュ補間ニュートン補間法を用いて解くことができ、シルベスターの公式英語版が導かれる。

例 1
例として、
の多項式表現を求めよう。固有値は λ = 1, 3, 固有多項式は p(x) = x2 − 4x + 3 である。剰余を r(x) = c0 + c1x と置き、固有値における値 f(λ) = r(λ) を評価して、線型方程式系 et = c0 + c1, e3t = c0 + 3c1 を得る。これを解けば c0 = (3et - e3t)/2 および c1 = (e3t - et)/2 を得るから、
となる。函数を g(A) = sin(At) に変えれば、係数は c0 = (3sin(t) − sin(3t))/2 および c1 = (sin(3t) − sin(t))/2 となるから
と求まる。
例 2
同様にして、
を考えると、固有多項式 p(x) = x2 + 1, 固有値 λ = i, -i であり、先と同様に固有値における値に関する連立方程式 eit = c0 + ic1, e−it = c0 - ic1 を解いて、c0 = (eit + e−it)/2 = cos(t) および c1 = (eit - e−it)/2i = sin(t) を得る。この場合の
回転行列である。

このような利用法の標準的な例は、行列リー群英語版への付随するリー環からの指数写像である。これは行列の指数函数

として与えられる。その多項式表示は SU(2) に対しては古くから知られており、パウリ行列 σ を用いて
と書ける。SO(3) も同様で
と書ける(これはロドリゲスの回転公式である)。記法については (rotation group SO(3)#A note on Lie algebraを見よ。

後に下れば、ほかの群に対する表示も知られており、例えばローレンツ群 SO(3, 1)[17], O(4, 2)[18], SU(2, 2)[19], GL(n, R)[20] など。ここに O(4, 2)時空共形群英語版SU(2, 2) はその単連結被覆(より精確には、O(4, 2)連結成分 SO+(4, 2) の単連結被覆)である。得られた多項式表示は、これら群の標準表現 (standard representation) に適用される。行列の冪を計算するために固有値に関するある種の知識が必要である。SU(2) の(したがって SO(3)) の)閉じた式は、近年にはすべての既約表現(例えば任意の spin)に対して得られている[21]

フェルディナント・ゲオルク・フロベニウス (1849–1917) はドイツの数学者。主な興味は楕円函数微分方程式、のちに群論
1878年、フロベニウスがケイリー–ハミルトンの定理の完全な証明を初めて与えた[13]

代数的数論[編集]

代数的整数の最小多項式の計算においてもケイリー–ハミルトンの定理は有用である。例えば、Q の有限次拡大 Q[α1, …, αk] とその代数的整数 α(これは添加された元の冪積 α n1
1
 
α nk
k
 
の非自明な Q-線型結合に書ける)が与えられたとき、α を掛けるという Q-線型変換

の表現行列を A と書けば、A にケイリー–ハミルトンの定理を適用することにより α の最小多項式が求まる[22]

一般の証明[編集]

既にみたように、任意の n × n 行列 に対してケイリー–ハミルトンの定理の主張を得るには、二つの段階を踏む必要がある。第一には固有多項式を t の多項式として展開してその各項の係数 ci を決定すること:

第二にこれらの係数を用いて作った A の冪たちの線型結合が零行列に等しいと示すこと:
である。この左辺は A の成分 aij 全てを変数に持つ(非常に巨大な)多項式を成分とする一つの n × n 行列であり、したがってケイリー–ハミルトンの定理はこれら n2 個の式の各々がすべて恒等的に 0 に等しいことを述べるものである。行列のサイズ n の値を一つに(どのような値にせよ)止めて考えるとき、これら恒等式を(うんざりするような、しかし)完全に代数的な直截手計算を行って得ることは原理的には可能である。しかしそれでは任意のサイズ n に対して成立すると主張するケイリー–ハミルトンの定理を証明したことにはならないので、すべての n に一様に適用できる証明を与える必要がある。

準備[編集]

n 成分ベクトル vA の固有値 λ に属する固有ベクトル(つまりAv = λv)ならば

は零ベクトルである(p(λ) = 0[注 5] ゆえ p(λ)v = 0)。これは可能なすべての固有値 λ に対して成立するから、定理に言う二つの行列(p(A) と零行列 O)が固有ベクトルの上では同じ値を有することは確定である。あるいは A がその固有ベクトルからなる基底を持てば、言葉を換えれば A対角化可能(半単純)ならば、ケイリー–ハミルトンの定理は成立しなければならない(基底の上で同じ値をとる二つの行列は、互いに等しい)。

全ての行列が対角化可能なわけではないが、これは複素係数行列のかなり多くの部分をカバーすることのできるものである(かなり多くというのは、「与えられたサイズの複素正方行列全体の成す集合において、対角化可能複素行列全体の成す集合は稠密である[23]」という意味で言う)。(行列が対角化可能であるためには、その固有多項式が単根のみを持てば十分である)。いま仮に定理が 0 になると主張する n2 個の式のどれかでも自明な関係式に帰着されない(すなわち行列の成分に関する非零多項式になるる)と仮定した場合、この非自明な多項式の部分まで 0 になるような複素行列全体の成す集合は、複素行列全体の成す集合において稠密でないから、先に見た対角化可能行列は定理を満たすという事実に反する。ゆえにケイリー–ハミルトンの定理が真である必要を見た。

前段落の論法は複素数を成分とする行列に対しては有効な証明を与えているが、定理の主張は行列の性質(対角化可能かどうか)やその成分がどういう種類でないといけないか(例えば成分を実数に制限すると、対角化可能行列は稠密部分集合ではない)は問わないから、これでは十分な証明とはいいがたい(なにより、それら行列に対して定理が成り立つことを見るときに、それらをすべて複素行列とみなければいけないのは奇妙である)。そこで以下では、任意の行列(それはもちろん任意の可換環に成分をとる行列も含む)に適用可能な代数的操作のみを用いた直接証明を与えることを考える。そのようなケイリー–ハミルトンの定理の証明の述べ方も非常に多彩に存在するが、以下に挙げるのはそのなかのいくつかだけである。証明の仕方によって、その証明を理解するのに必要な抽象代数学的概念の量も変わってくる。最も初等的なレベルでの証明では、必要な代数学的概念としては定理の定式化に用いられた「行列」「多項式」「成分となるスカラー(数値)」「行列式」くらいしか用いないようにすることはできるが、その反面正しい結論がきちんと導かれているという事実がある種の寓話とでも思えるような技巧的な計算をしなければならない。そういった点に対しては、(詳細までは知らなくてもいいけれども)「非可換環係数の多項式」や「普通とは違う成分を持つ行列」といったより奇妙な代数的概念を用いることには価値をおくことができる。

余因子行列の転置
以下に示す全ての証明において、n × n 行列 M余因子行列転置である随伴行列英語版[注 6] adj(M) が用いられる。この行列の各成分は M の成分に関する多項式として与えられる(実はある種の (n − 1)×(n − 1) 行列式として書ける)が、さらに以下の基本関係式
(adj)
の成立は重要である。この関係式は行列式の基本性質からの直接の帰結として得られる。実際、左からの積の (i,j)-成分の値は、行列 M の第 i-列を第 j-列のコピーで置き換えたもの(つまり、i = j のときは det(M) でそれ以外は零)の行列式展開を与える。右辺の積も同様に行に関して展開する。
注意
この関係式が単純な代数的計算のみで得られたものであるということは、それが任意の可換環に成分をとる行列に対して有効な関係式であることを意味することに注意すべきである(環の可換性は行列式が定義されているために仮定する必要がある)。あとで多項式のような数でないものを成分とする行列に対してこの関係式を適用するので、いまこの注意をしておくことは重要である。

代数的な直截証明[編集]

この証明では、ケイリー–ハミルトンの定理の定式化に必要な概念として「多項式を成分とする行列」を用いる。A の固有多項式を定義する行列 tIn − A もまたそのような行列である。多項式の全体は可換環をなすから、この行列の余因子行列の転置

が存在して、基本関係式により

(1)

が成り立つ。 この B もまた t を変数とする多項式を成分とする行列であるから、各 i に対して行列の各成分から ti の項だけを取り出してまとめたものを係数行列 Bi として、

(B)

と書き直すことができる(B の定義の仕方から、tn−1 より高次の冪は現れないことに注意)。これはあたかも「行列を係数に持つ多項式」であるように見えるが、ここではそのような概念を用いないで、単に多項式を成分とする行列を n 個の定数成分行列の線型結合として書く便法とみる(それを強調するために ti は係数として左側に書いている)。

さて等式 1 を積の双線型性により展開すれば

の形に書ける(これは t の冪を係数とする定数成分行列の線型結合として書いた、多項式を成分とする二つの行列の間の等式である)。このような等式が成立するためには、両辺の同じ位置にある成分について各 ti の係数が等しくなければならない。つまり、両辺の各 ti を係数とする定数成分行列がそれぞれ等しくなることが必要である。このような係数比較英語版 により、
を得る。これにそれぞれ(比較に用いた ti に応じて)Ai を掛けて足し合わせた
畳み込み和としてすべての項が打ち消しあうから、p(A) = O を得て証明が完了する。

行列係数の多項式を用いた証明[編集]

まず、前節の証明に現れる式によって示唆される「行列係数の多項式」という概念について正当化しておく。これには非可換環係数の多項式というある意味普通ではないものを考えることになるので、入念に注意を払う必要が出てくる。通常の多項式で正当化されることが、いまの設定では適用できないということが多々起こる。[注 7]

著しい点として、通常の可換環係数の多項式に対する算術は、多項式を多項式函数と同一視して函数としての(点ごとの)演算を雛形とすることができるが、非可換環係数ではそれは可能ではない(実は、非可換環上での場合には、乗法のもとで閉じる多項式函数の明らかな概念は存在しない)。それゆえ、行列係数の変数 t に関する多項式を考えるときには、変数 t は係数環の任意の値を取りうる「未知数」と考えてはいけなくて、いくつかの決まったルールに従う形式的な記号としての「不定元」として扱うべきである。特に t に特定の値を代入しようというのは危険である。[注 7]

.

適当な環 R(例えば実数体 R や複素数体 C)に成分を持つ n × n 行列全体の成す環M(n, R) と書き、その一つの元として行列 A をとる。t に関する多項式を係数として持つ行列、例えば tIn − A やその余因子行列(の転置行列)B なとは M(n, R[t]) の元である。t の同じ次数の冪を含む項をまとめることにより、M(n, R[t]) に属する行列を t を変数とする行列係数の「多項式」の形に書き表すことができる。行列係数の多項式全体の成す集合を M(n, R)[t] と書けば、M(n, R)[t]M(n, R[t]) との間に一対一対応が存在するから、それにより対応する算術演算を定義することができる。とくに乗法は

で与えられる。これは明らかに非可換な乗法である(特に右辺の係数における積の順番は、左辺の対応する因子の現れる順番を反映するようにしなければならない)。[注 7]

この設定で、等式 M(n, R)[t] の元の間の乗法を含む式と見なすことができる。この時点で、単に t が行列 A に等しいとおく誘惑にかられそうになる(そうすれば左辺は零行列で右辺は p(A) になるから)が、これは係数が可換でないときには許されない操作である[注 7]。それでも非可換環 M 上で「右評価写像」evA: M[t] → M は定義できる(これは各 tiA の冪 Ai で置き換えるが、この冪は常に対応する係数の右から掛けるものと約束するものである)。ただしこれは環準同型にならない(積の右評価写像の値は右評価写像の積とは一般には異なる)から、行列係数多項式の乗法が t を係数環に属する未知数と見ての乗法を雛形としたものでないことが確認できる(積 Mti⋅Ntj = (MN)ti+j は変数 t は常に N と可換と仮定することで定義できるが、これは t を行列 A で置き換えるときには常には期待できない。ただし、手近な特定の状況を想定する場合にはこの問題をうまく回避できることもある(たとえば、上記の右評価写像は行列 A が係数環の中心に属している場合には(どの多項式でもすべての係数と A は可換になるから)環準同型になる)。

ケイリー–ハミルトンの定理の証明では M を行列環全体と考えるならば A は必ずしも中心に属するわけではないけれども、M としてより小さい環(証明に現れるすべての多項式の係数すべてを含んでいるようなもの)に取り換えて、その中の元すべてが A と可換になるようにするという手段をとることはできる。明らかに、A と可換な行列全体として与えられる部分環(すなわち A の中心化環)Z はそのような部分環の候補になる(定義により、AZ の中心元である)。この中心化環が In および A を含んでいることは明らかだが、tIn − A の余因子行列の転置 (adjugate matrix) B に現れる ti の係数 Bi を含むことも示せる。実際、余因子行列の転置の基本関係として

が成り立つが、これに B = ∑m
i= 0
Bi⋅ti
を代入して整理すれば
が残る。各 i に対して係数比較英語版を行うことにより、所期の式 ABi = BiA が得られる。

このように実際に evA が環準同型となる適切な設定の下が求められたからには、定理の証明は

として完成する。

ふたつの証明の折衷[編集]

最初の証明において、B の係数 Bi は随伴行列の基本関係式 (adj) の右辺だけに基づいて決定することができる。実は導かれた最初の n 本の式は、多項式 p(t)Inモニック多項式 IntA除したB を決定するものと解釈することができ、また最後の式はその除した剰余が零であるという事実を表すと解釈できる。この割り算は行列係数多項式の環において行われる。実際、非可換環係数の場合においてさえも、モニック多項式 P によるユークリッド除法(余り付き除算)は定義され、通常(可換環上)と同様に次数に関する条件を満たす商と剰余が常に一意的に取り出される(ここで P がどちら側因子であるかは決まっていることが前提である。いまのばあいは左因子である)。

ここでの主張において重要な点である「商と剰余が一意であること」を見るには、二通りの表示 PQ + r = PQ′ + r′ があったとしてそれを P(Q − Q′) = r′ − r の形に書けば十分である。実際、P はモニック(最高次係数 1)であるから P(Q − Q′) の次数は Q = Q′ でなければ P の次数より小さくはならない。

しかしここで用いた被除数 p(t)In も除数 Int − A もともに部分環 (R[A])[t] に属している(ここで R[A]A の生成する行列環 M(n, R) の部分環、すなわち A のすべての冪によって R線型に張られる集合である)。したがって、実は上記の割り算は可換多項式環の中で実行できるものであり、もちろんこの小さい環においても同じ商 B と剰余 0 が与えられる。このことから特に B が実は (R[A])[t] に属すことが分かる。このように可換環部分環の中で考えれば、等式 p(t)In = (tIn − A)B において tA とおくことは有効、すなわち評価写像

は環準同型となり第二の証明と同じく所期の を与える。

定理を証明することに加えて、上記の論法では B の係数 BiA に関する多項式であることまでわかる(これに対して、第二の証明からはそれらは A の中心化環 Z に入ることしかわからない。一般に ZR[A] より大きな部分環であり、可換とも限らない)。特に定数項 B0 = adj(−A)R[A] に入る。A は勝手な正方行列でよかったのだから、これにより adj(A) が常に A の多項式に書ける(係数は A ごとに変わる)ことが保証される。

実は最初の証明で求めた等式により順番に A の多項式として表すことができ、任意の n × n 行列に対して有効な恒等式

が導かれる。ここに、ciA の固有多項式 p(t) = tn + cn−1tn−1 + ⋯ + c1t + c0 のものである。

この恒等式はケイリー–ハミルトンの定理の主張を含意するものである。実際、adj(−A) を右辺に移項してから A を(左から、あるいは右から)掛け、基本関係式 (adj) からわかる
を入れれば所期の式である。

抽象化・一般化[編集]

上で述べた通り、定理の主張における行列 p(A) は、先に行列式を評価してからその後で行列 A を変数 t に代入して得るものであり、行列式を計算する前に行列 tIn − A に代入を行うことは意味をなさない。にも拘らず、p(A) をある特定の行列式の値として直截に得ることのできる解釈を与えることは可能である。

ただしこれには、環上の行列 A とはその成分 aij のことともそれらの全体としての A そのものとも解釈できるというような、やや面倒な状況を設定する必要がある。すなわち、環 R 上の n × n 行列全体の成す環 M(n, R) の中で、成分 aij はスカラー行列 aijIn として実現されるし、A それ自体も入っている。しかし行列を成分とする行列は、ここでの意図でないブロック行列との混同を引き起こしかねない(ブロック行列と考えると行列式の概念が正しく与えられない[注 8])。状況をよりはっきりさせるため、基底 e1, …, en を持つ n-次元ベクトル空間(係数環 R が体でないときは n-階 R-自由加群)V 上の自己準同型 φ を行列 A と区別をつけて、全自己準同型環 V 上の行列を考えることにする。そうすると、各 φ ∈ End(V) は行列の成分になれるし、その一方で行列 A とは各 (i, j)-成分がスカラー aij-倍するという自己準同型になっているような M(n, End(V)) の元を指すものとできる(同様に単位行列 InM(n, End(V)) の元と解釈される)。

ただし、End(V) は可換環ではないから、M(n, End(V)) の全体で定義される行列式は存在せず、End(V) の可換部分環上の行列に限った場合にだけ行列式が定義できることには注意しなければならない。いま、問題の行列 φIn − A の成分はすべて、φ と恒等変換で R 上生成される可換部分環 R[φ] に属しているから、行列式をとる写像 det: M(n, R[φ]) → R[φ] は定義されて、det(φIn − A)A の固有多項式を φ において評価した値とすることができる(このことは Aφ との間に成り立つ関係とは無関係に成り立つ)。

この設定で、ケイリー–ハミルトンの定理の主張は p(φ)零写像となることである。この設定での定理の証明を以下に示す(これは(中山の補題と関連した)より一般の形で (Atiyah & MacDonald 1969, Prop. 2.4) にあるものである):

この証明を検討すれば、固有多項式をとる行列 A は、多項式に代入する値としての φ と同一である必要がないことが分かる。すなわち V 上の自己準同型 φ は、最初に与えた等式 φ(ei) = ∑
j
aji⋅ej
を、何らかの元の列 e1, …, en に対して満足すればよい(これらの元の生成する空間を改めて V と書けば上記の証明を追うことができる)。この元の列には基底のような独立性は仮定しないでよいから、生成される空間の次元は n よりも小さくなり得るし、係数環が体でないときは自由加群でない場合も出てくる。

そうして R を生成系 {e1, …, en} を持つ任意の可換環とし、R の自己準同型 φ の上記生成系に関する表現行列が A = (aij), すなわち

を満たすものとする設定のもとでのハミルトン–ケイリーの定理: pφ(φ) = 0 が満足されることが正当化できる。

このように一般化された状況におけるこの定理は可換環論および代数幾何学において重要な中山の補題の源流である。

[編集]

注釈[編集]

  1. ^ 四元数の乗法およびそれを用いた任意の構成(この文脈では特に行列式が顕著)には非可換性がかかわってくるから、十分に定義を検討する必要がある。分解型四元数に対するケイリー–ハミルトンの定理も(やや素性はよくない英語版が)同様に成立する[11]。四元数の場合も分解型四元数の場合も、ある種の 2 × 2 複素行列として表すことができる(ノルム 1 に制限すれば、これらの乗法の定める作用はそれぞれ特殊ユニタリ群 SU(2) および SU(1, 1) である)から、これらに対して定理が成り立つことは驚くことではない。そのような行列表現のできない八元数(八元数の乗法は非結合的であるから行列の積で表現することは不合理)でさえ、それでも修正版のケイリー–ハミルトンの定理が満足される[12]
  2. ^ 「天然(の)」という意味ではなく、permutation(置換)と determinant(行列式)を合成したカバン語のモジり。直訳的に合成すれば「置換式」。(テンソルの交代積に対する対称積のように、置換の符号を掛ける部分を取り除いて)行列式の反対称性を対称性で置き換えた対応物なので「対称的行列式」のように呼べるかもしれない。
  3. ^ これら係数の陽な表示は
    で与えられる。ただし、和は n
    l=1
    l⋅kl = ni
    を満たす分割 {kl ≥ 0} 全体の成す集合上を亙る
  4. ^ 例えば(ヤコビの公式英語版を解いている)(Brown 1994, p. 54) などを見よ:
    ただし B後で述べる随伴行列である。これと同値な、再帰的に関係したアルゴリズムをユルバン・ルヴェリエドミトリー・ファデーエフ英語版が導入した。そのファデーエフ–ルヴェリエアルゴリズム英語版からは
    が導かれる(例えば Gantmacher 1960, p. 88 を見よ)。A−1 = −Mn/c0 が再帰の終端となる。あとで述べる代数的証明では、件の随伴行列 BkMn−k の満たす性質に依拠している。具体的には および上記の p の微分を追跡すれば を得[16]、上記の再帰手続きが順に繰り返される。
  5. ^ A の固有値とは固有多項式 p(t) の根のことであった
  6. ^ 複素行列の共軛転置である随伴行列と混同してはならない
  7. ^ a b c d (佐武 1958, p. 137, 注意)によれば、「行列係数の多項式に関して乗法の交換の法則は一般には成立しないが,それ以外(加減乗の演算に関する限り)通常の多項式と全く同様に取り扱うことができる.また行列係数の多項式の間の等式には,それら係数行列のすべてと交換可能な行列を代入することができる.(係数行列と非可換な行列は代入することができない.)行列係数の多項式に関して整除の問題は複雑である」とある。
  8. ^ 行列式は行列の成分たちの積和であることを思い出そう。したがって、R 上の行列を成分に持つ行列の行列式はそれ自体が R 上の一つの行列である(係数環 R の元ではない)。つまり、ブロック行列の各ブロックをそれ自体一つの行列とみて、ブロック行列を行列の行列と考えるなら、その行列式はブロックたちの積和の形をしていなければならない。その一方、R上のブロック行列の成分は(ブロックではなくその中の)係数環 R の元自体であり、したがってブロック行列の行列式はそれ自身もまた R の元であって、両者の概念は一般には一致しない。

出典[編集]

  1. ^ a b Crilly 1998.
  2. ^ a b Cayley 1858, pp. 17–37.
  3. ^ Cayley 1889, pp. 475–496.
  4. ^ a b Hamilton 1864a.
  5. ^ a b Hamilton 1864b.
  6. ^ a b Hamilton 1862.
  7. ^ Eisenbud 1995, p. 120, Theorem 4.3 (Cayley-Hamilton).
  8. ^ Atiyah & MacDonald 1969.
  9. ^ Hamilton 1853, p. 562.
  10. ^ Zhang 1997.
  11. ^ Alagös, Oral & Yüce 2012.
  12. ^ Tian 2000.
  13. ^ a b Frobenius 1878.
  14. ^ Garrett 2007, p. 381.
  15. ^ 佐武 1958, p. 137, 注—「なお fA(A) = |AE − A| = 0 で証明終!と早合点してはいけない.」
  16. ^ Hou 1998.
  17. ^ Zeni & Rodrigues 1992.
  18. ^ Barut, Zeni & Laufer 1994a.
  19. ^ Barut, Zeni & Laufer 1994b.
  20. ^ Laufer 1997.
  21. ^ Curtright, Fairlie & Zachos 2014.
  22. ^ Stein, William. Algebraic Number Theory, a Computational Approach. pp. 29. http://wstein.org/books/ant/ant.pdf. 
  23. ^ Bhatia 1997, p. 7.

参考文献[編集]

外部リンク[編集]