5.3 对角化
Contents
在很多情况下,从分解式A=PDP^{-1},我们能够了解到有关矩阵A的特征值和特征向量的信息。
如果方阵相似于对角矩阵,即存在可逆矩阵P和对角矩阵D,有A=PDP^{-1},则称A可对角化。
定理5 (对角化定理)
nxn矩阵A可对角化的充分必要条件是A有n个线性无关的特征向量。
事实上,A=PDP^{-1},D为对角矩阵的充分必要条件是P的列向量是A的n个线性无关的特征向量。此时,D的主对角线上的元素分别是A的对应于P中特征向量的特征值。
换句话说,A可对角化的充分必要条件是有足够的特征向量形成R^n的基,我们称这样的基为特征向量基
矩阵的对角化
例3 可能的话,将下面矩阵对角化
即求可逆矩阵P和对角矩阵D,使得A=PDP^{-1}
解 对角化工作可分为4步来完成。
第一步 求出A的特征值。在5.2节曾提到过,在矩阵的规模大于2×2时,可借用计算机求特征值,为避免分心,本书将会提供这一步的内容,现在的特征方程是一个3次多项式,可分解为:
特征值是\lambda=1和\lambda=-2.
第二步 求A的3个线性无关的特征向量。因为A是3×3的,故需要3个向量。这一步很关键,如果找不到这3个向量,那么由定理5,A就不能对角化,用5.1节的方法可求出每一特征空间的基:
你可以验证\{v_1,v_2,v_3\}是线性无关的。
第3步 用第2步得到的向量构造矩阵P向量的次序不重要,用第二步选择的次序,形成
第4步 用对应的特征值构造矩阵D。构造D时,特征值的次序必须和矩阵P选择的特征向量的次序一致。对应\lambda=-2的特征向量有2个,特征值\lambda=-2要出现两次:
验证所招的P和D是否正好是一个好的习惯,为避免计算P^{-1},可简单验证AP=PD,这等价于当P可逆时A=PDP^{-1}。(但必须确认P是可逆的!)我们计算
\left[\begin{array}{rrr}1&-1&-1\\-1&1&0\\1&0&1\\ \end{array}\right]
=\left[\begin{array}{rrr}1&2&2\\-1&-2&0\\1&0&-2\\ \end{array}\right]
\left[\begin{array}{rrr}1&0&0\\0&-2&0\\0&0&-2\\ \end{array}\right]
=\left[\begin{array}{rrr}1&2&2\\-1&-2&0\\1&0&-2\\ \end{array}\right]
定理6 有n个相异特征值的nxn矩阵可对角化。
不过,nxn矩阵并不需要n个相异特征值才可对角化,例3的3×3矩阵尽管只有2个相异的特征值,但它是可对角化的。
特征值不是都相异的矩阵
如果nxn矩阵A有n个相异的特征值及相应的特征向量v_1,\dots,v_n,如果记P=\begin{bmatrix}v_1&\dots &v_n\end{bmatrix},那么由定理2,P的列时线性无关的,自然P是可逆的。当A可对角化,但A相异的特征值的个数少于n时,我们仍可以用以下定理给出的方法来构造可逆矩阵P。
定理7 设A是nxn矩阵,其相异的特征值是\lambda_1,\dots,\lambda_P.
a. 对于1\le k\le p,\lambda_k的特征空间的维数小于或等于\lambda_k的代数重数。
b. 矩阵A可对角化的充分必要条件是所有不同矩阵空间的维数之和为n.即每个\lambda_k的特征空间的维数等于\lambda_k的代数重数。
c. 若A可对角化,\beta_k是对应于\lambda_k的特征空间的基,那么,集合\beta_1,\dots,\beta_p中所有向量的集合是R^n的特征向量基