對元素為實數或複數的n×n矩陣A,求數λn維非零向量 x使Ax=λx,這樣的問題稱為代數特徵值問題,也稱矩陣特徵值問題,λ和 x分別稱為矩陣A的特徵值和特徵向量。代數特徵值問題題的數值解法是計算數學的主要研究課題之一,它常出現於動力系統和結構系統的振動問題中。在常微分方程和偏微分方程的數值分析中確定連續問題的近似特征系,若用有限元方法或有限差分方法求解,最終也化成代數特征值問題。此外,其他數值方法的理論分析,例如確定某些迭代法的收斂性條件和初值問題差分法的穩定性條件,以及討論計算過程對舍入誤差的穩定性問題等都與特征值問題有密切聯系。求解矩陣特征值問題已有不少有效而可靠的方法。

  矩陣A的特征值是它的特征多項式Pn(λ)≡det(λI-A)的根,其中I為單位矩陣。但階數超過4的多項式一般不能用有限次運算求出根,因而特征值問題的計算方法本質上是迭代性質的,基本上可分為向量迭代法和變換方法兩類。

  向量迭代法是不破壞原矩陣A,而利用A對某些向量作運算產生迭代向量的求解方法,多用來求矩陣的部分極端特征值和相應的特征向量,特別適用於高階稀疏矩陣。乘冪法、反冪法都屬此類,隆措什方法也常作為迭代法使用。

  變換方法是利用一系列特殊的變換矩陣(初等下三角陣、豪斯霍爾德矩陣、平面旋轉矩陣等),從矩陣A出發逐次進行相似變換,使變換後的矩陣序列趨於容易求得特征值的特殊形式的矩陣(對角陣、三角陣、擬三角陣等);多用於求解全部特征值問題,其優點是收斂速度快,計算結果可靠,但由於原矩陣A被破壞,當A是稀疏矩陣時,在計算過程中很難保持它的稀疏性,因而大多數變換方法隻適於求解中小規模稠密矩陣的全部特征值問題。雅可比方法、吉文斯-豪斯霍爾德方法以及LR方法、QR方法等都屬此類。

  乘冪法 計算矩陣的按模最大的特征值及對應特征向量的一種向量迭代法。設A為具有線性初等因子的矩陣,它的n個線性無關的特征向量是ui(i=1,2,…,n),特征值排列次序滿足

是一個 n維非零向量, 於是

若│ λ 1│>│ λ 2│,則當 α 1≠0,且 k足夠大時, A k z 0除相差一個純量因子外趨於 λ 1所對應的特征向量,這就是乘冪法的基本思想。實際計算中最簡單情況的乘冪法的迭代格式是:取初始向量 z 0,計算

式中 中絕對值最大的一個分量,這時

一般情形下,由於計算格式依賴於 A的特征值的分佈情況,實際使用很不方便,隻是在求階數非常高的矩陣的個別特征值和相應的特征向量時偶爾使用。然而乘冪法的基本思想是重要的,由它可導出許多實用的計算方法,例如反冪法和子空間迭代法,它也是其他一些有效計算方法(例如LR方法,QR方法)的理論基礎。

  子空間迭代法 又稱同時迭代法,乘冪法的直接推廣,能同時求出模最大的一些特征值和相應的特征向量。它與乘冪法的差別主要在二個方面:①同時用p(p>1)個正交規范向量進行類似於乘冪法的迭代,將迭代向量看作一個p維子空間的正交規范基,每次迭代後得到一個新的子空間;②迭代過程中,在p維子空間上應用裡茨原理進行加速。這個方法更便於使用計算機自動計算,而且加快瞭收斂速度,是大型稀疏矩陣特征值問題的有效解法。

  反冪法 又稱反迭代,其原理是:設矩陣A非奇異,為求A的模最小的特征值和相應的特征向量而對A-1使用乘冪法。A-1的特征值次序是

z 0為初始向量,迭代格式為

在一定條件下 反冪法的每次迭代要解一個線代數方程組。這種原始的反冪法在實際計算中很少應用,實際使用的反冪法總是帶原點位移的,且位移常取為已求得的近似特征值,而用反冪法求其對應的特征向量。設慞 iA的某特征值 λ i的近似值,帶原點位移慞 i的反冪法的迭代格式是:取初始向量 z 0,計算

時, 按方向收斂於特征向量 u i,收斂商是 i越精確,收斂就越快,但 就越接近奇異矩陣,因而在迭代過程中需要求解非常病態的方程組。然而已經證明,這個病態性質對於反冪法的按方向收斂於特征向量是無關緊要的,而且當慞 i相當精確時,一般隻要一、二次反迭代就可求得相當精確的近似特征向量。反冪法是由已知近似特征值求對應近似特征向量的有效方法。

  隆措什方法 用相似變換將矩陣A約化為三對角矩陣的一種方法,其特點是不破壞原矩陣A。目前能實際使用的是A對稱時的對稱隆措什方法:取初始向量v1,‖v1‖=1,遞推地計算 

式中 α iβ i由使{ v i}為正交規范化的條件確定,即 當精確計算時 v n+1=0,上述過程可寫成矩陣形式 其中 T n是對稱三對角矩陣

它的特征值可由二分法求得。由於舍入誤差的影響,隆措什方法所產生的隆措什向量很快失去正交性,因而這方法長期來被認為不穩定,很少用於實際計算。近年來對隆措什方法作瞭深入研究,進行瞭大量實際計算和細致的誤差分析,並且觀察到如下的所謂隆措什現象:將 m步遞推關系寫為 其中 m維行向量。對足夠大的 m,矩陣 T m的特征值包括 A的所有相異特征值。註意,當出現舍入誤差時,可能 mn。對高階矩陣 A,對不大的 m( mn), T m常包含 A的相當精確的近似特征值。由於隆措什方法的這一特性,還由於該方法能保持 A的稀疏性,所以目前它已成為求高階對稱稀疏矩陣部分特征值的最有效方法。

  雅可比方法 對稱矩陣可以通過正交相似變換化為對角陣,其對角元是原矩陣的全部特征值。雅可比方法就是通過一系列特殊的正交相似變換──雅可比旋轉,使對稱矩陣近似對角化從而求得特征值和特征向量的方法。記A0=A,作正交相似序列

其中 R k是( pq)超平面的雅可比旋轉矩陣,即

p、q的選取應使 中非對角元絕對值最大者。 A kA k - 1僅在第 p行(列)和第 行(列)不同,它們之間的關系為

可使

k 時, A K趨於對角陣,這就是經典雅可比方法。此方法在第 k次變換前要搜索 A k-1的非對角元中絕對值最大者以確定雅可比旋轉矩陣的旋轉平面,但這很費時間。為避免這種消耗,可改用循環雅可比方法:在 n( n-1)/2次的相繼雅可比旋轉(稱為一次掃描)中,每個非對角元,不管按什麼次序,恰好消去一次。其中最方便的是特殊循環雅可比方法,即每次掃描都按(1,2),(1,3),…,(1, n);(2,3),…,(2, n);…;( n-1, n)的次序進行。實際計算中最廣泛使用的是特殊循環雅可比方法的一種變形,稱為閾雅可比方法:確定一個正數作閾值,在特殊循環的一次掃描中隻對絕對值超過閾值的非對角元所在的平面進行旋轉變換,反復掃描,當所有非對角元的絕對值都不超過閾值時減小閾值,再按新的閾值進行掃描,如此繼續下去,直至閾值充分小而達到近似對角化。雅可比方法的優點是:能在求特征值的同時求得相當精確的近似正交規范特征向量系;缺點是:與其他變換方法相比,收斂速度較慢。它適用於求解低階稠密矩陣的全部特征值問題,對近似對角(即非對角元素較小)的對稱矩陣特別有效,常應用於子空間迭代法的裡茨加速過程中。

  吉文斯-豪斯霍爾德方法 一種計算對稱矩陣A的全部或部分特征值及對應特征向量的方法,包括下述三個主要部分:①利用豪斯霍爾德變換(正交相似變換)將A化為對稱三對角矩陣C,整個過程由n-2步組成,第r步的變換矩陣是

其中

A 0= A,當 A r -1的第 r階順序主子矩陣已是三對角形時,第 r步將 A r-1變換為 使 A r的第 r+1階順序主子矩陣是三對角的。經 n-2步變換後,得到對稱三對角矩陣

法計算C 的特征值。當 β i≠0(i=2,3,…, n)時,由C- λ I的順序主子式組成的多項式序列 P 0( λ)≡1, P 1= α 1- λ 構成一個斯圖姆序列。用 αα)表示 P 0( α), P 1( α),…, P n( α)中相鄰二數符號一致的數目,它就是 P nλ)在[ α )中根的個數。設C 的特征值是 λ 1λ 2>…> λ n,而 α( l 0)≥ mα( u 0)≤r> m。用 二等分[ l 0u 0],計算 αr 1)。若 αr 1)≥ m,則 l 1= r 1u 1= u 0;否則取 l 1= l 0u 1= r 1。因此 繼續進行這樣的二分過程,就可求得 λ m的近似值。③應用帶近似特征值位移的反冪法求C 的對應特征向量,再利用①中的變換矩陣 Q 1Q 2,…, Q n -2求得 A的對應特征向量。吉文斯-豪斯霍爾德方法速度快,計算過程穩定,一般說來優於雅可比方法,但它也要破壞原矩陣,因而適用於求解中小型矩陣的特征值問題。

  LR方法 原理及基本算法如下:當A的前n-1個順序主子式不為零時,可將A分解為A=LR,其中L是單位下三角陣,R是上三角陣。記A1=A,進行迭代循環:作AKLR分解

計算 由此得矩陣序列{ A K},每個 A K都與 A相似:

件下, A KR( k ),其中 R是上三角陣,其對角元是 A的全部特征值。實際計算中為加快收斂速度常引進原點位移,記第 k次迭代的原點位移為 s K,帶原點位移的LR算法是:

所得矩陣序列{ A K}中的每個矩陣也都與 A相似, s K常取為 A K的右下角元素。LR方法主要用於求解復矩陣的特征值問題,其優點是計算量少,收斂速度快,缺點是計算穩定性差,適用范圍較小。求得近似特征值後,常用帶位移的反冪法求對應特征向量。

  QR方法 求矩陣特征值的最有效方法之一,是LR方法的酉類似,基本算法如下:作A的分解A=QR,其中Q是酉矩陣,R是上三角陣。記A1=A,進行迭代循環

矩陣序列{ A K}中每一矩陣都與 A相似:

Q H表示矩陣 Q的共軛轉置矩陣。在一定條件下 A k趨於上三角陣,但其上三角部分的元素不一定有極限,這樣的收斂稱為基本收斂,這對求特征值來說已足夠,因為基本收斂的“極限矩陣”的對角元是 A的全部特征值。每次迭代需作一次 Q R分解和一次矩陣乘法。為減少計算量,總是先將 A經酉相似變換化為上黑森貝格矩陣 H,再對 H應用 QR算法,上黑森貝格矩陣經QR迭代仍保持上黑森貝格形。為加速QR過程的收斂,常引進原點位移,它和帶位移的LR算法完全類似,第 k步的位移 s k常取為 A k的右下角元素 ,或右下角二階矩陣的特征值中最接近 者。帶原點位移的QR算法的漸近收斂速度至少是2次,當 A對稱時可達3次。對實矩陣 A,當 A有復共軛特征值時帶實原點位移的QR算法不可能收斂,為此發展瞭對實矩陣的雙重步QR算法,其基本思想是將可能帶復原點位移的QR算法中的相繼二步合並成一個雙重步以避免復運算。當求得近似特征值後,可用帶位移的反冪法求對應的特征向量。

  病態特征值問題 對特征值問題Ax=λx,設A的元素經小的擾動ΔA(即‖ΔA‖/‖A‖很小)變為AA,特征值λ(假定是單的)和特征向量 x相應地變為λ+Δλ和x+Δx,若|Δλ|/‖ΔA‖(或‖Δx‖/‖ΔA‖)非常大,則稱特征值λ(或特征向量x)是病態的,否則稱為良態的。病態與否是特征值問題的固有性質,與用何種方法進行數值求解無關。然而,誤差分析理論指出,受原始數據在計算機中表示的舍入誤差和數值方法求解過程中舍入誤差的影響而求得的對A的特征值問題的近似解,等於對AA的特征值問題的精確解,這裡ΔA是一族依賴於數值方法的擾動矩陣。穩定的數值方法能保證‖ΔA‖/‖A‖是小的,但不能使病態問題變成良態的。求解病態特征值問題是近年發展起來的矩陣不變子空間計算的重要內容。

  廣義特征值問題數值解法 最一般的矩陣特征值問題是非線性的。設T(λ)是n×n矩陣,其元素是λ的解析函數,確定數λ和非零向量x,使Tλ)x=0,這稱為非線性特征值問題,λ是特征值,x是相應的特征向量。一種重要的特殊情況是一次廣義特征值問題:ABn×n矩陣,求數λ和非零向量x,使Ax=λBx,B=I時就是通常特征值問題;較一般的是r次廣義特征值問題:Ai(i=1,2,…,r)是n×n矩陣,求數λ和非零向量x,使

。令x (0)=x,

r次廣義特征值問題即可化為一次廣義特征值問題:

的非線性特征值問題,當用線性化方法求解時,最終也歸為求解一系列一次廣義特征值問題。對於一次廣義特征值問題 Ax= λ Bx,當 B非奇異時,可化為通常特征值問題( B -1 A)x= λx,當 AB對稱,且 B正定時,可化為對稱特征值問題( U -T AU -1)( Ux)= λ( Ux),其中 UB的喬萊斯基分解 BU T U中的上三角陣。利用化為通常特征值問題來求解一次廣義特征值問題有時是很有效的,但有下列缺點:①當 AB是稀疏矩陣,特別是帶形矩陣時,約化後的矩陣 B -1 AU -T AU -1一般是稠密的;②當 B關於求逆的性態很差時,直接約化會帶來很大誤差。對一次廣義特征值問題已發展瞭不少其他有效解法而不必預先化到通常特征值問題,一類是松弛法,包括逐次超松弛法、逐次坐標超松弛法和共軛梯度法等;另一類是變換方法,包括廣義雅可比方法、廣義吉文斯方法以及QZ方法等,後者是QR方法對一次廣義特征值問題的直接推廣。

  

參考書目

 曹志浩著:《矩陣特征值問題》,上海科學技術出版社,上海,1980。