跳转至

讲义-特征值专题

约 8170 个字 预计阅读时间 28 分钟

参考书目:《线性代数:未竟之美》

本讲义用于竺可桢学院线性代数线上辅学课程,奈何本人水平有限,有些地方在课程中可能表述不清晰,还请多多包涵。

引入

Quote

线性代数的一大目标是:我们希望找到出发空间和到达空间合适的基使得线性映射在这两组基下的表示更简单(尽可能多的零,尽量向对角矩阵靠近).我们将眼光放在线性变换,即出发空间和到达空间相同的线性映射,并且我们关注 出发空间与到达空间取同一组基的时候,如何取基,可以把同一个线性映射的矩阵尽可能表示得简单

基的转换<->矩阵的转换

从矩阵在不同基下的的表示出发

假设我们有一个在 nn 维线性空间 V\mathbf{V} 上线性变换 σ\sigma ,其在基 B={ε1,ε2,,εn}\mathbf{B}=\{\varepsilon_1,\varepsilon_2,\ldots,\varepsilon_n\} (B\mathbf{B} 的每个列向量是都是一个基)下的矩阵为 AA,即

σ(ε1,ε2,,εn)=(ε1,ε2,,εn)A \sigma (\varepsilon_1,\varepsilon_2,\ldots,\varepsilon_n) = (\varepsilon_1,\varepsilon_2,\ldots,\varepsilon_n)A

假设我们很幸运,找到了另外一组基 B={ε1,ε2,,εn}\mathbf{B'}=\{\varepsilon_1',\varepsilon_2',\ldots,\varepsilon_n'\},并且已知这个线性映射在这组基下的矩阵很漂亮,是对角的Λ\Lambda,即

σ(ε1,ε2,,εn)=(ε1,ε2,,εn)Λ \sigma (\varepsilon_1',\varepsilon_2',\ldots,\varepsilon_n') = (\varepsilon_1',\varepsilon_2',\ldots,\varepsilon_n') \Lambda

如果又恰好知道两组基之间的过渡矩阵

{ε1,ε2,,εn}={ε1,ε2,,εn}P \{\varepsilon_1',\varepsilon_2',\ldots,\varepsilon_n'\} = \{ \varepsilon_1,\varepsilon_2,\ldots,\varepsilon_n \} P

那么我们可以推导出

AP=PΛ(1) A P = P \Lambda \tag{1}
P1AP=Λ P^{-1} A P = \Lambda

PP为什么一定可逆?(基之间的互相表示)

继续由上面的式子(1),我们展开,pip_i为矩阵PP的第ii个列向量

AP=A(p1,p2,,pn)=(p1,p2,,pn)(λ10000λ20000λ30000λn) A P = A ( p_1, p_2,\ldots,p_n ) = ( p_1, p_2,\ldots,p_n )\begin{pmatrix} \lambda_1 & 0 & 0 & \cdots & 0 \\ 0 & \lambda_2 & 0 & \cdots & 0 \\ 0 & 0 & \lambda_3 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \lambda_n \end{pmatrix}

展开对应相等

Api=λipi Ap_i = \lambda_i p_i

Key-point

这一过程给我们的启发是,如果我们知道AA可以达到的对角化的矩阵是怎么样的,那么可以逆推出变换矩阵,从而找出这组基是怎么样的;上面的λi\lambda_i,与pip_i就是我们今天要讨论的特征值与特征向量,如何寻找它们就是我们今天的重点;

特征值与特征向量

定义

Definition

σ\sigma是线性空间V(F)V(\mathbf{F})上的一个线性变换,如果存在数λF\lambda\in\mathbf{F}和非零向量ξV\xi\in V使得σ(ξ)=λξ\sigma(\xi)=\lambda\xi,则称数λ\lambdaσ\sigma的一个特征值,并称非零向量ξ\xiσ\sigma属于其特征值λ\lambda的特征向量

同构地,对于矩阵而言,有:

设矩阵AMn(F)A\in \mathbf{M}_n(\mathbf{F}),如果存在数λF\lambda\in\mathbf{F}和非零向量XFnX\in\mathbf{F}^n使得AX=λXAX=\lambda X,则称数λ\lambdaAA的一个特征值,称非零向量XXAA属于其特征值λ\lambda的特征向量.

Property

σ\sigmaV(F)V(\mathbf{F}) 上的线性变换,II 为恒等映射,则下述条件等价:

  1. λF\lambda \in \mathbf{F}σ\sigma 的特征值;
  2. σλI\sigma - \lambda I 不是单射 \Leftrightarrow AλEA-\lambda E 列不满秩;
  3. σλI\sigma - \lambda I 不是满射 \Leftrightarrow AλEA-\lambda E 行不满秩;
  4. σλI\sigma - \lambda I 不可逆 \Leftrightarrow AλEA-\lambda E 不可逆(行列式为0)

对于第二第三条的矩阵版本有疑问的同学可以回顾 LALU 相抵标准型一节给出的定理:

线性映射是单射当且仅当其矩阵表示为列满秩矩阵,线性映射是满射当且仅当其矩阵表示为行满秩矩阵.

特征多项式

由上述性质,λF\lambda\in\mathbf{F}σ\sigma的特征值等价于λEA=0|\lambda E-A|=0,故我们可以通过λEA=0|\lambda E-A|=0求解特征值,其中AAσ\sigma在某组基下的矩阵,EE为单位矩阵. 对于特征向量的求解,求出(λEA)X=0(\lambda E-A)X=0的非零解就是特征向量在基α1,,αn\alpha_1,\ldots,\alpha_n下的坐标,如果是矩阵的特征向量,那么XX就是解.

上述求解特征向量的方法需要我们求解f(λ)=λEAf(\lambda)=|\lambda E-A|的根,我们将f(λ)f(\lambda)称为特征多项式

Example

A=(1102011a0)A=\begin{pmatrix} 1 & -1 & 0 \\ 2 & 0 & 1 \\ 1 & a & 0 \end{pmatrix},且存在非零向量α\alpha使得Aα=2αA\alpha=2\alpha,求aa.

Answer

由题意知2是矩阵AA的特征值,因此我们有

2EA=1102211a2=9a=0|2E-A|=\begin{vmatrix} 1 & 1 & 0 \\ -2 & 2 & -1 \\ -1 & -a & 2 \end{vmatrix}=9-a=0

因此a=9a=9.

特征多项式可以写为以下的形式

对于nn级矩阵A=(aij)A=(a_{ij}),记

f(λ)=λEA=a0λn+a1λn1++an1λ+anf(\lambda)=|\lambda E-A|=a_0\lambda^n+a_1\lambda^{n-1}+\cdots+a_{n-1}\lambda+a_n

a0=1a_0=1a1=tr(A)a_1=-\mathbf{tr}(A)an=(1)nAa_n=(-1)^n|A| ,且aka_k等于所有kk级主子式之和乘以(1)k(-1)^k.

由韦达定理

一元n次韦达定理

设方程 a0xn+a1xn1++an1x+an=0 a_0 x^n + a_{1} x^{n-1} + \cdots + a_{n-1} x + a_n = 0 有根 x1,x2,,xn x_1, x_2, \ldots, x_n . 那么:

  • 各根之和:
x1+x2++xn=i=1nxi=a1a0 x_1 + x_2 + \cdots + x_n = \sum_{i=1}^{n} x_i = -\frac{a_{1}}{a_0}
  • 各根之积:
x1x2xn=i=1nxi=(1)nana0 x_1 x_2 \cdots x_n = \prod_{i=1}^{n} x_i = (-1)^n \frac{a_n}{a_0}
  • i=1nλi=i=1naii\displaystyle\sum_{i=1}^{n}\lambda_i=\sum_{i=1}^{n}a_{ii}

  • i=1nλi=A\displaystyle\prod_{i=1}^{n}\lambda_i=|A|.

相似与特征多项式

Question

  • 相似矩阵有相同的特征多项式?(从而有相同的迹,行列式,特征值;),即ABA\sim BλEA=λEB|\lambda E-A|=|\lambda E-B|吗?反过来呢?
Answer

B=P1APB=P^{-1}AP,则λEB=λEP1AP=P1(λEA)P=P1λEAP=λEA|\lambda E-B|=|\lambda E-P^{-1}AP|=|P^{-1}(\lambda E-A)P|=|P^{-1}||\lambda E-A||P|=|\lambda E-A|. 因此ABA\sim BλEA=λEB|\lambda E-A|=|\lambda E-B|.

我们知道特征多项式相同则特征值相同,迹等于所有特征值之和,行列式等于所有特征值之积,因此相似矩阵有相同的迹,行列式,特征值.

  • 如果是,那么同一特征值的特征向量之间有什么关系?
Answer

P1AP=BP^{-1}AP=B,则A,BA,B分别属于同一特征值λ\lambda的特征向量XXYY满足Y=P1XY=P^{-1}X.

AX=λ0XAX=\lambda_0 X以及A=PBP1A=PBP^{-1},我们有PBP1X=λ0XPBP^{-1}X=\lambda_0 X,即BP1X=λ0P1XBP^{-1}X=\lambda_0 P^{-1}X,因此P1XP^{-1}XBB属于λ0\lambda_0的特征向量,即P1XP^{-1}XBB的特征向量,即Y=P1XY=P^{-1}X.

回忆基的选择导致同一向量在不同基下的坐标表示,实际上这个问题就是该定理的推论;

同一向量在不同基下的坐标表示

设线性空间VV的两组基为B1B_1B2B_2,且基B1B_1B2B_2的变换矩阵(过渡矩阵)为AA,如果ξV(F)\xi \in V(\mathbf{F})B1B_1B2B_2下的坐标分别为XXYY,则Y=A1XY=A^{-1}X.

ξ=(α1,,αn)X=(β1,,βn)Y.\xi=(\alpha_1,\ldots,\alpha_n)X=(\beta_1,\ldots,\beta_n)Y.

将过渡矩阵的条件B2=B1AB_2=B_1A,即(β1,,βn)=(α1,,αn)A(\beta_1,\ldots,\beta_n)=(\alpha_1,\ldots,\alpha_n)A代入上式可得:

ξ=(α1,,αn)X=(α1,,αn)AY.\xi=(\alpha_1,\ldots,\alpha_n)X=(\alpha_1,\ldots,\alpha_n)AY.

又由于ξ\xi在线性无关向量组α1,,αn\alpha_1,\ldots,\alpha_n下的坐标唯一,故我们有X=AYX=AY,即Y=A1XY=A^{-1}X.

Example

回答以下两个问题:

  1. A,BA,B 均为 nn 阶矩阵,证明:λ0\lambda\neq 0ABAB 的特征值,则 λ\lambda 也是 BABA 的特征值;

  2. AMm×n(C),BMn×m(C)A\in \mathbf{M}_{m\times n}(\mathbf{C}),\enspace B\in \mathbf{M}_{n\times m}(\mathbf{C}),证明:

(ABOBO)(OOBBA) \begin{pmatrix} AB & O \\ B & O \end{pmatrix} \sim \begin{pmatrix} O & O \\ B & BA \end{pmatrix}

并由此推出 ABABBABA 非零特征值相同,且 m=nm=n 时有 λEAB=λEBA|\lambda E-AB|=|\lambda E-BA|.

Proof
  1. XXABAB 属于 λ\lambda 的特征向量,则 ABX=λXABX=\lambda X,因此 B(ABX)=B(λX)B(ABX)=B(\lambda X),即 (BA)(BX)=λ(BX)(BA)(BX)=\lambda(BX),因此 BXBXBABA 属于 λ\lambda 的特征向量,故 λ\lambda 也是 BABA 的特征值。

实际上这里还有一点需要说明,就是 BX0BX\neq 0,否则它将不能作为特征向量。事实上证明是简单的,假设 BX=0BX=0,则 ABX=0ABX=0,由于 λ0\lambda\neq 0,因此必然有 X=0X=0,但这与 XXABAB 属于 λ\lambda 的特征向量矛盾,因此 BX0BX\neq 0

  1. 根据分块矩阵初等变换的性质,我们可以通过不断尝试选取到 P=(EmAOEn)P=\begin{pmatrix} E_m & A \\ O & E_n \end{pmatrix},其逆矩阵为 P1=(EmAOEn)P^{-1}=\begin{pmatrix} E_m & -A \\ O & E_n \end{pmatrix},我们发现恰有
(EmAOEn)(ABOBO)(EmAOEn)=(OOBBA). \begin{pmatrix} E_m & -A \\ O & E_n \end{pmatrix} \begin{pmatrix} AB & O \\ B & O \end{pmatrix} \begin{pmatrix} E_m & A \\ O & E_n \end{pmatrix} = \begin{pmatrix} O & O \\ B & BA \end{pmatrix}.

因此 (ABOBO)\begin{pmatrix} AB & O \\ B & O \end{pmatrix}(OOBBA)\begin{pmatrix} O & O \\ B & BA \end{pmatrix} 相似,因此它们的特征多项式相同,即

λEmABOBλEn=λEmOBλEnBA. \begin{vmatrix} \lambda E_m-AB & O \\ -B & \lambda E_n \end{vmatrix} = \begin{vmatrix} \lambda E_m & O \\ -B & \lambda E_n-BA \end{vmatrix}.

根据行列式的计算性质 AOCB=AB\begin{vmatrix} A & O \\ C & B \end{vmatrix} = |A||B|,我们有

λEmABλEn=λEmλEnBA, |\lambda E_m-AB||\lambda E_n| = |\lambda E_m||\lambda E_n-BA|,

λnλEmAB=λmλEnBA\lambda^n|\lambda E_m-AB| = \lambda^m|\lambda E_n-BA|,因此 ABABBABA 非零特征值相同,且 m=nm=n 时有 λEAB=λEBA|\lambda E-AB|=|\lambda E-BA|.

对于可逆矩阵PP,我们知道了AAB=P1APB=P^{-1}AP有相同的特征值,如果PP不可逆,两个矩阵又有什么关系呢?

我们有以下结论

Property

A,BA,B分别为数域F\mathbf{F}nn阶、mm阶方阵,A,BA,Brr个两两不等的公共特征值,则矩阵方程AXXB=OAX-XB=O有秩为rr的矩阵解. 反之,若数域为复数域,矩阵方程AXXB=OAX-XB=O有秩为rr的矩阵解,则A,BA,B至少有rr个公共的特征值(计重数).

证明见 《LALU》.P465

Example

mm阶矩阵AAnn阶矩阵BB无公共复特征值,CCm×nm\times n矩阵,则矩阵方程AXXB=CAX-XB=C存在唯一解.

Answer

VV是所有m×nm\times n矩阵构成的线性空间,定义VV上的线性变换σ(X)=AXXB,XV\sigma(X)=AX-XB,\enspace X\in V. 由于AABB无公共复特征值,所以σ(X)=AXXB=O\sigma(X)=AX-XB=O只有零解,即σ\sigmaVV上单射,可知σ\sigma是满射且是同构映射. 于是,对任意的CVC\in V,都存在唯一的X0VX_0\in V使得σ(X0)=C\sigma(X_0)=C,即矩阵方程AXXB=CAX-XB=C存在唯一解X0X_0.

特征值的性质与结论

  • λ\lambda是线性空间V(F)V(\mathbf{F})上的线性变换σ\sigma的特征值,ξ\xiσ\sigma属于λ\lambda的特征向量,则

    • kλk\lambdakσk\sigma的特征值,λm\lambda^mσm\sigma^m的特征值,且ξ\xi仍是相应特征向量;

    • f(x)=anxn+an1xn1++a1x+a0f(x)=a_nx^n+a_{n-1}x^{n-1}+\cdots+a_1x+a_0F\mathbf{F}上的多项式,则f(σ)(ξ)=f(λ)ξf(\sigma)(\xi)=f(\lambda)\xi

  • λ\lambdann阶矩阵AA的特征值,AA可逆,则λ1\lambda^{-1}A1A^{-1}的特征值,Aλ1|A|\lambda^{-1}AA的伴随矩阵AA^*的特征值,且特征向量不变.

  • AAnn阶矩阵,则AAATA^\mathrm{T}有相同的特征值(含重数).

  • AA可逆/AA不可逆/E+AE+A可逆/4E+A4E+A不可逆;

  • EA2=0|E-A^2|=0

  • A2=EA^2=E(对合)/A2=AA^2=A(幂等)/Ak=0A^k=0(幂零);

  • A=λ0E+BA=\lambda_0E+Bλ0\lambda_0为常数,且已知BBnn个特征值为λ1,λ2,,λn\lambda_1,\lambda_2,\ldots,\lambda_n);

  • AA为对角块矩阵,即A=diag(A1,A2,,Am)A=\mathbf{diag}(A_1,A_2,\ldots,A_m).

Proof

1 由于σ(ξ)=λξ\sigma(\xi) = \lambda\xi,则(kσ)(ξ)=kλξ(k\sigma)(\xi) = k\lambda\xi,即kλk\lambdakσk\sigma的特征值,ξ\xi仍是相应特征向量。

σm(ξ)=σm1(σ(ξ))=σm1(λξ)=λσm1(ξ)==λmξ\sigma^m(\xi) = \sigma^{m-1}(\sigma(\xi)) = \sigma^{m-1}(\lambda\xi) = \lambda\sigma^{m-1}(\xi) = \cdots = \lambda^m\xi,即λm\lambda^mσm\sigma^m的特征值,ξ\xi仍是相应特征向量。

2 利用前述σm\sigma^m的相关性质,我们有
f(σ)(ξ)=(anσn+an1σn1++a1σ+a0I)(ξ) f(\sigma)(\xi) = (a_n\sigma^n + a_{n-1}\sigma^{n-1} + \cdots + a_1\sigma + a_0I)(\xi)
=anσn(ξ)+an1σn1(ξ)++a1σ(ξ)+a0I(ξ) = a_n\sigma^n(\xi) + a_{n-1}\sigma^{n-1}(\xi) + \cdots + a_1\sigma(\xi) + a_0I(\xi)
=anλnξ+an1λn1ξ++a1λξ+a0ξ = a_n\lambda^n\xi + a_{n-1}\lambda^{n-1}\xi + \cdots + a_1\lambda\xi + a_0\xi
=f(λ)ξ. = f(\lambda)\xi.

3 ξ\xiAA的特征值,即Aξ=λξA\xi = \lambda\xi,则ξ=A1Aξ=A1λξ\xi = A^{-1}A\xi = A^{-1}\lambda\xi,即A1ξ=λ1ξA^{-1}\xi = \lambda^{-1}\xi,因此λ1\lambda^{-1}A1A^{-1}的特征值,ξ\xi仍是相应特征向量。

又由于AA可逆时A=AA1A^* = |A|A^{-1},根据前面关于kσk\sigmaA1A^{-1}特征值的讨论可知,Aλ1|A|\lambda^{-1}AA的伴随矩阵AA^*的特征值,ξ\xi仍是相应特征向量。

4 我们用特征多项式证明。实际情况是,ATA^\mathrm{T}的特征多项式为λEAT=(λEA)T=λEA|\lambda E - A^\mathrm{T}| = |(\lambda E - A)^\mathrm{T}| = |\lambda E - A|(回忆转置不改变行列式),实际上与AA的特征多项式完全一致,因此ATA^\mathrm{T}AA有相同的特征值(含重数)。

5 AA可逆时有 A=λ1λn0|A| = \lambda_1 \cdots \lambda_n \neq 0,因此AA的特征值都不为0。 同理,AA不可逆同理表明存在特征值等于0,E+AE+A可逆表明1-1不是AA的特征值,4E+A4E+A不可逆表明4-4AA的特征值。

6 EA2=EAE+A=0|E - A^2| = |E - A||E + A| = 0,因此±1\pm 1都是AA的特征值。

7 我们首先考虑对合矩阵,接下来的同理可以得到类似结论。由于A2=EA^2 = E,设AX=λXAX = \lambda X,则A2X=λ2X=XA^2 X = \lambda^2 X = X,因此λ2=1\lambda^2 = 1,即λ=±1\lambda = \pm 1,因此111-1AA的特征值。

:本题解决过程中告诉我们一个解题技巧,如果看到AA的多项式f(A)=Of(A) = O这种形式的表达式,事实上AA的特征值只能是f(λ)=0f(\lambda) = 0的根,如上题中f(A)=A2Ef(A) = A^2 - E,则f(λ)=λ21f(\lambda) = \lambda^2 - 1,因此AA的特征值只能是±1\pm 1

同理,我们可以知道幂等矩阵的特征值只能是0和1,幂零矩阵的特征值只能是0(这是一个重要的幂零矩阵等价条件,未来我们会再次遇到)。

8 BX=λiXi (Xi0,i=1,,n)BX = \lambda_i X_i\ (X_i \neq 0,\enspace i = 1,\ldots,n),则
AXi=λ0Xi+BXi=λ0Xi+λiXi=(λ0+λi)Xi AX_i = \lambda_0 X_i + BX_i = \lambda_0 X_i + \lambda_i X_i = (\lambda_0 + \lambda_i) X_i
因此λ0+λi (i=1,,n)\lambda_0 + \lambda_i \ (i = 1,\ldots,n)都是AA的特征值。

9 证明

λEA=λE1A1000λE2A2000λEmAm=i=1mλEiAi=0 |\lambda E - A| = \begin{vmatrix} \lambda E_1 - A_1 & 0 & \cdots & 0 \\ 0 & \lambda E_2 - A_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda E_m - A_m \end{vmatrix} = \prod_{i=1}^{m} |\lambda E_i - A_i| = 0

因此,Ai,i=1,,mA_i,\enspace i = 1,\ldots,m的特征值都是AA的特征值。

Example

  • α=(1,0,1)T\alpha=(1,0,-1)^\mathrm{T},且A=ααTA=\alpha\alpha^\mathrm{T},求6EAn|6E-A^n|

  • AA为三阶矩阵,其特征值为1,2,11,-2,-1,求A|A|A+3EA^*+3E的特征值,(A1)2+2E(A^{-1})^2+2E的特征值以及A2A+E|A^2-A+E|

  • AA为三阶矩阵,A2A2E=OA^2-A-2E=OA=2|A|=2,求A+3E|A^*+3E|

  • AA为三阶矩阵,其特征值为1,1,5-1,-1,5,求A11+A22+A33A_{11}+A_{22}+A_{33}

Answer
  • 事实上A=ααT=(101000101)A=\alpha\alpha^\mathrm{T}=\begin{pmatrix} 1 & 0 & -1 \\ 0 & 0 & 0 \\ -1 & 0 & 1 \end{pmatrix},由λEA=0|\lambda E-A|=0解得AA的特征值为λ1=λ2=0,λ3=2\lambda_1=\lambda_2=0,\lambda_3=2,而根据AnA^n的特征值性质可知,6EAn6E-A^n的特征值为6λ1n,6λ2n,6λ3n6-\lambda_1^n,6-\lambda_2^n,6-\lambda_3^n,即6,6,62n6,6,6-2^n,因此6EAn=62(62n)=36(62n)|6E-A^n|=6^2(6-2^n)=36(6-2^n).

  • 由于AA的特征值为1,2,11,-2,-1,因此A=1×(2)×(1)=2|A|=1\times(-2)\times(-1)=2,而AA^*的特征值为Aλ1|A|\lambda^{-1},因此AA^*的特征值为2,1,22,-1,-2,故A+3EA^*+3E的特征值为AA^*的特征值加3(即为5,2,15,2,1,又根据A1A^{-1}A2A^2特征值的性质可知,(A1)2+2E(A^{-1})^2+2E的特征值为12+2,(1/2)2+2,(1)2+21^2+2,(-1/2)^2+2,(-1)^2+2,即为3,9/4,33,9/4,3,而A2A+EA^2-A+E的特征值根据f(σ)f(\sigma)特征值性质的讨论可知为121+1,(2)2(2)+1,(1)2(1)+11^2-1+1,(-2)^2-(-2)+1,(-1)^2-(-1)+1,即为1,7,31,7,3,因此A2A+E=1×7×3=21|A^2-A+E|=1\times 7\times 3=21.

  • AX=λX(X0)AX=\lambda X(X\neq 0),则(A2A2E)X=(λ2λ2)X=O(A^2-A-2E)X=(\lambda^2-\lambda-2)X=O,因此λ=1\lambda=-1λ=2\lambda=2,根据对合矩阵的讨论可知,AA的特征值恰为-1和2. 又A=2|A|=2,且AA为3阶矩阵,因此AA的3个特征值必为-1,-1,2.

AA^*的特征值为Aλ1|A|\lambda^{-1},因此AA^*的特征值为1,2,21,-2,-2A+3EA^*+3E的特征值为AA^*的特征值加3,即λ1=λ2=1,λ3=4\lambda_1=\lambda_2=1,\lambda_3=4,故A+3E=λ1λ2λ3=4|A^*+3E|=\lambda_1\lambda_2\lambda_3=4.

  • 由题意知A=5|A|=5,故AA^*的特征值为Aλ1|A|\lambda^{-1}即为μ1=μ2=5,μ3=1\mu_1=\mu_2=-5,\mu_3=1,而A11+A22+A33A_{11}+A_{22}+A_{33}就是AA^*的迹(即矩阵对角线元素之和),因此A11+A22+A33=μ1+μ2+μ3=9A_{11}+A_{22}+A_{33}=\mu_1+\mu_2+\mu_3=-9.

特征向量与特征子空间的性质

  • σ\sigma的不同特征值对应的特征向量线性无关;

  • σ\sigma的不同特征值对应的特征子空间的和为直和;

  • σ\sigma最多有dimV\dim V个不同的特征值.

有以下推论

Proof
  • λ1,,λm\lambda_1, \ldots, \lambda_mσ\sigma 的互异特征值,ξ1,,ξm\xi_1, \ldots, \xi_m 是相应的特征向量。反证法,我们假设 ξ1,,ξm\xi_1, \ldots, \xi_m 线性相关,由线性相关性引理可知,存在 kk 是使得
ξkspa(ξ1,,ξk1) \xi_k \in \mathbf{spa}(\xi_1, \ldots, \xi_{k-1})

成立的最小整数,则存在 c1,,ck1c_1, \ldots, c_{k-1} 使得

ξk=c1ξ1++ck1ξk1. \xi_k = c_1\xi_1 + \cdots + c_{k-1}\xi_{k-1}.

σ\sigma 作用到上式两边,我们有

λkξk=c1λ1ξ1++ck1λk1ξk1. \lambda_k \xi_k = c_1 \lambda_1 \xi_1 + \cdots + c_{k-1} \lambda_{k-1} \xi_{k-1}.

将上式两边乘以 λk\lambda_k,然后减去上式,我们有

0=c1(λkλ1)ξ1++ck1(λkλk1)ξk1. 0 = c_1 (\lambda_k - \lambda_1)\xi_1 + \cdots + c_{k-1} (\lambda_k - \lambda_{k-1})\xi_{k-1}.

由于我们选取的 kk 是满足 ξkspa(ξ1,,ξk1)\xi_k \in \mathbf{spa}(\xi_1, \ldots, \xi_{k-1}) 的最小整数,因此 ξ1,,ξk1\xi_1, \ldots, \xi_{k-1} 线性无关,故 c1==ck1=0c_1 = \cdots = c_{k-1} = 0,因此 ξk=0\xi_k = 0,这与 ξk\xi_k 是特征向量矛盾,因此 ξ1,,ξm\xi_1, \ldots, \xi_m 线性无关。

  • 回忆直和的证明方法,我们选取合适等价命题进行证明。假设

ξ1++ξm=0, \xi_1 + \cdots + \xi_m = 0,

其中 ξiVλi\xi_i \in V_{\lambda_i},由于 σ\sigma 的不同特征值对应的特征向量线性无关,因此 ξ1,,ξm\xi_1, \ldots, \xi_m 不可能是特征向量,否则可知它们线性相关,故必有 ξ1==ξm=0\xi_1 = \cdots = \xi_m = 0,这表明 σ\sigma 的不同特征值对应的特征子空间的和为直和。

  • λ1,,λm\lambda_1, \ldots, \lambda_mσ\sigma 的互异特征值,ξ1,,ξm\xi_1, \ldots, \xi_m 是相应的特征向量。前面已经证明了 ξ1,,ξm\xi_1, \ldots, \xi_m 线性无关,因此 dimVm\dim V \geqslant m,得证。
  • λ1,,λm\lambda_1,\ldots,\lambda_m是线性映射σ\sigma互异的特征值,则VλijiVλj={0}(i=1,,m)V_{\lambda_i}\cap\sum\limits_{j\neq i}V_{\lambda_j}=\{0\} \enspace(i=1,\ldots,m),则一个特征向量不能属于多个特征值.

  • σ\sigma的不同特征值λ1,,λm\lambda_1,\ldots,\lambda_m对应的特征子空间Vλ1,,VλmV_{\lambda_1},\ldots,V_{\lambda_m}的基向量合在一起构成的向量组线性无关,且是Vλ1+Vλ2++VλmV_{\lambda_1}+V_{\lambda_2}+\cdots+V_{\lambda_m}的基.

Definition

  • 代数重数:某一特征值λ\lambda的代数重数指重根的个数;
  • 几何重数:某一特征值的几何重数指特征向量生成线性空间的维数

λ\lambdaσ\sigma的特征值,则λ\lambda的代数重数大于等于几何重数

我们思考,如果所有的特征子空间已经是全空间VV,那么是否所有向量都是特征向量呢?下面的例子告诉我们不是这样的,事实上,只有当特征值唯一的时候,这个结论才正确:

2013-2014期末

V(F)V(\mathbf{F})nn 维线性空间,σL(V)\sigma \in \mathcal{L}(V),证明:

  1. α,β\alpha, \betaσ\sigma 的属于不同特征值的特征向量,则 c1c20c_1c_2 \neq 0 时,c1α+c2βc_1 \alpha + c_2 \beta 不是 σ\sigma 的特征向量;
  2. VV 中的每一非零向量都是 σ\sigma 的特征向量     σ=c0IV\iff \sigma = c_0 I_V,其中 c0Fc_0 \in \mathbf{F} 是一个常数,IVI_V 是恒等变换。
Proof
  1. σ(α)=λ1α,σ(β)=λ2β\sigma(\alpha) = \lambda_1 \alpha, \sigma(\beta) = \lambda_2 \beta,其中 λ1λ2\lambda_1 \neq \lambda_2,并假设 c1α+c2βc_1 \alpha + c_2 \betaσ\sigma 的特征向量,即存在 λ0F\lambda_0 \in \mathbf{F} 使得
    σ(c1α+c2β)=λ0(c1α+c2β). \sigma(c_1 \alpha + c_2 \beta) = \lambda_0 (c_1 \alpha + c_2 \beta).
    展开括号,我们有
    c1σ(α)+c2σ(β)=c1λ0α+c2λ0β. c_1 \sigma(\alpha) + c_2 \sigma(\beta) = c_1 \lambda_0 \alpha + c_2 \lambda_0 \beta.

    c1λ1α+c2λ2β=c1λ0α+c2λ0β, c_1 \lambda_1 \alpha + c_2 \lambda_2 \beta = c_1 \lambda_0 \alpha + c_2 \lambda_0 \beta,

    (λ1λ0)c1α+(λ2λ0)c2β=0. (\lambda_1 - \lambda_0) c_1 \alpha + (\lambda_2 - \lambda_0) c_2 \beta = 0.
    由于 α,β\alpha, \beta 线性无关,因此
    c1(λ1λ0)=c2(λ2λ0)=0. c_1 (\lambda_1 - \lambda_0) = c_2 (\lambda_2 - \lambda_0) = 0.
    c1c20c_1 c_2 \neq 0 时,我们有 λ1=λ0=λ2\lambda_1 = \lambda_0 = \lambda_2,这与 λ1λ2\lambda_1 \neq \lambda_2 矛盾,因此 c1α+c2βc_1 \alpha + c_2 \beta 不是 σ\sigma 的特征向量。

  2. 右推左显然,我们只考虑左推右的证明。由上一小问结论可知,若 VV 中的每一非零向量都是 σ\sigma 的特征向量,σ\sigma 不可能有不同的特征值(因为有不同的特征值就有不同特征值对应的特征向量,但它们的线性组合一定仍在 VV 中,这与从第一问中得到的结论,即它不是 σ\sigma 的特征向量矛盾)。设 c0c_0σ\sigma 的唯一的特征值,则对于任意 αV\alpha \in V,我们有 σ(α)=c0α\sigma(\alpha) = c_0 \alpha,即 σ\sigma 在任意元素上的像都已经唯一确定,则显然在 VV 的一组基上的像也唯一确定,由线性映射唯一确定的定理可知这样的线性映射是唯一的,σ=c0IV\sigma = c_0 I_V 符合要求,因此它就是我们要找的线性映射。

Example

AA 是数域 F\mathbf{F} 上一个 nn 阶方阵,EEnn 阶单位矩阵,α1Fn\alpha_1 \in \mathbf{F}^nAA 的属于特征值 λ\lambda 的一个特征向量,向量组 α1,α2,,αs\alpha_1, \alpha_2, \ldots, \alpha_s 按如下方式产生:

(AλE)αi+1=αi,i=1,2,,s1.(A - \lambda E) \alpha_{i+1} = \alpha_i, \quad i = 1, 2, \ldots, s-1.

证明向量组 {α1,α2,,αs}\{\alpha_1, \alpha_2, \ldots, \alpha_s\} 线性无关。

Proof

由于 α1\alpha_1AA 属于特征值 λ\lambda 的特征向量,故有 (AλE)α1=0(A - \lambda E) \alpha_1 = 0


i=1skiαi=0, \sum_{i=1}^{s} k_i \alpha_i = 0,
两边同时左乘 (AλE)(A - \lambda E) 可得
(AλE)i=1skiαi=i=1ski(AλE)αi=k1(AλE)α1+i=1s1ki+1αi=i=1s1ki+1αi=0. (A - \lambda E) \sum_{i=1}^{s} k_i \alpha_i = \sum_{i=1}^{s} k_i (A - \lambda E) \alpha_i = k_1 (A - \lambda E) \alpha_1 + \sum_{i=1}^{s-1} k_{i+1} \alpha_i = \sum_{i=1}^{s-1} k_{i+1} \alpha_i = 0.

以此类推,在等式两边不断左乘 (AλE)(A - \lambda E) 可得:对于 r{1,,s1}\forall r \in \{1, \cdots, s-1\} 都有
i=1srki+rαi=0. \sum_{i=1}^{s-r} k_{i+r} \alpha_i = 0.

r=s1r = s-1 得到 ksα1=0,ks=0k_s \alpha_1 = 0, \quad k_s = 0。再依次代回不难得到 ki=0,i{1,,s}k_i = 0, \quad \forall i \in \{1, \cdots, s\},从而向量组 α1,,αs\alpha_1, \cdots, \alpha_s 线性无关。

可对角化的条件

可对角化

σL(V)\sigma\in\mathcal{L}(V),如果存在VV的一组基使得σ\sigma在这组基下的矩阵是对角矩阵,则称σ\sigma可对角化.

VV是数域F\mathbf{F}上的nn维线性空间,σ\sigmaVV上的线性变换,λ1,λ2,,λsF\lambda_1,\lambda_2,\ldots,\lambda_s\in\mathbf{F}σ\sigma的所有互异特征值,则以下条件等价:

  1. σ\sigma 可对角化;
  2. σ\sigmann 个线性无关的特征向量,它们构成 VV 的一组基;
  3. VV 有在 σ\sigma 下不变的一维子空间 U1,,UnU_1, \ldots, U_n,使得 V=U1UnV = U_1 \oplus \cdots \oplus U_n
  4. V=Vλ1Vλ2VλsV = V_{\lambda_1} \oplus V_{\lambda_2} \oplus \cdots \oplus V_{\lambda_s}
  5. n=dimVλ1+dimVλ2++dimVλsn = \dim V_{\lambda_1} + \dim V_{\lambda_2} + \cdots + \dim V_{\lambda_s}
  6. σ\sigma 每个特征值的代数重数等于几何重数。

有推论

nn 阶矩阵 AAnn 个不同的特征值,则 AA 可对角化. 反之,AA 可对角化不一定有 nn 个特征值.

Key-point

总结而言,只要特征子空间可以张成整个空间,那么这个线性变换就是可对角化的。

对角化的基本步骤

  1. 先任意写出 σ\sigma 在一组基 B\mathbf{B} 下的矩阵 AA,当然为了计算方便一般选取自然基;
  2. 利用特征多项式 f(λ)=λEA=0f(\lambda) = |\lambda E − A| = 0 求出 AA 的所有不同特征值;
  3. 解线性方程组 AX=λXAX = \lambda X(实际上就是方程组 (λEA)X=0(\lambda E − A)X = 0,其中 λ\lambda 是上一步求 出的特征值)求出 AA 在不同特征值下的线性无关特征向量;
  4. 第三步中求得的所有向量就是 λ\lambda 的特征向量在基 BB 下的坐标,根据前面的讨论,σ\sigma 的特征向量也就是使得 σ\sigma 的矩阵表示为对角矩阵的那组基.
  5. 当然,如果题目中直接给出求 PP 使得 P1APP^{−1}AP 为对角矩阵,那么我们只需进行 2、3 两步,并将 3 中得到的向量按列排列成矩阵 P 即可 6.如果要求PP是正交矩阵,那么3中求出来的所有向量需要在 各自的特征子空间中正交化

Example

求矩阵

A=(011101110)A=\begin{pmatrix} 0 & -1 & 1 \\ -1 & 0 & 1 \\ 1 & 1 & 0 \end{pmatrix}

的所有特征值,对应的特征子空间,以及与 AA 相似的一个对角矩阵.

Answer

对于求解矩阵的对角化问题,首先求出其特征多项式(具体步骤不展开,实际上就是三阶行列式的计算,可以使用按行(列)展开、公式法或者初等变换化为三角矩阵等方法)f(λ)=λEA=(λ1)2(λ+2)f(\lambda)=|\lambda E-A|=(\lambda-1)^2(\lambda+2),令f(λ)=0f(\lambda)=0,解得特征值为 λ1=λ2=1,λ3=2\lambda_1=\lambda_2=1,\lambda_3=-2.

接下来求解特征向量和特征子空间,即求解(EA)x=0(E-A)x=0和解(2EA)x=0(-2E-A)x=0,得到特征值1对应的特征子空间为spa((1,1,0)T,(1,0,1)T)\mathbf{spa}((-1,1,0)^{\mathrm{T}},(1,0,1)^{\mathrm{T}}),特征值-2对应的特征子空间为spa((1,1,1)T)\mathbf{spa}((-1,-1,1)^{\mathrm{T}}).

AA相似的对角矩阵实际上就是特征值排列在对角线上的结果,即 diag(1,1,2)\mathbf{diag}(1,1,-2).

Example

TT 是次数小于等于 2 的实多项式线性空间 VV 上的变换,对任意 f(x)Vf(x) \in V,定义

T(f(x))=d((x2)f(x))dxT(f(x))=\frac{\mathrm{d}((x-2)f(x))}{\mathrm{d}x}

证明 TTVV 上的线性变换,且TT可对角化.

Answer

首先证明这是线性变换. 首先验证线性性,对于任意f(x),g(x)Vf(x),g(x)\in Va,bRa,b\in\mathbf{R},我们有

T(af(x)+bg(x))=d((x2)(af(x)+bg(x)))dx=d(axf(x)2af(x)+bxg(x)2bg(x))dx=ad((x2)f(x))dx+bd((x2)g(x))dx=aT(f(x))+bT(g(x)).\begin{align*} T(af(x)+bg(x)) & =\frac{\mathrm{d}((x-2)(af(x)+bg(x)))}{\mathrm{d}x} \\ & =\frac{\mathrm{d}(axf(x)-2af(x)+bxg(x)-2bg(x))}{\mathrm{d}x} \\ & =a\frac{\mathrm{d}((x-2)f(x))}{\mathrm{d}x}+b\frac{\mathrm{d}((x-2)g(x))}{\mathrm{d}x} \\ & =aT(f(x))+bT(g(x)). \end{align*}

然后说明这是VV上的线性变换,即该映射的到达空间是VV,即T(f(x))VT(f(x))\in V, 因为f(x)f(x)是次数小于等于2的实多项式,设f(x)=ax2+bx+cf(x)=ax^2+bx+c,则

T(f(x))=d((x2)(ax2+bx+c))dx=d(ax3+(b2a)x2+(c2b)x2c)dx=3ax2+2(b2a)x+(c2b)V.\begin{align*} T(f(x)) & =\frac{\mathrm{d}((x-2)(ax^2+bx+c))}{\mathrm{d}x} \\ & =\frac{\mathrm{d}(ax^3+(b-2a)x^2+(c-2b)x-2c)}{\mathrm{d}x} \\ & =3ax^2+2(b-2a)x+(c-2b)\in V. \end{align*}

因此TTVV上的线性变换.

下面我们来判断TT是否可对角化. 线性变换的可对角化问题第一步要转化为任意一组基下的矩阵,然后判断矩阵是否可对角化,因此我们先任意选取一组基,为方便我们选取自然基{1,x,x2}\{1,x,x^2\},然后求出TT在这组基下的矩阵A=(120024003)A=\begin{pmatrix} 1 & -2 & 0 \\ 0 & 2 & -4 \\ 0 & 0 & 3 \end{pmatrix},然后求出其特征多项式f(λ)=λEA=(λ1)(λ2)(λ3)f(\lambda)=|\lambda E-A|=(\lambda-1)(\lambda-2)(\lambda-3),令f(λ)=0f(\lambda)=0,解得特征值为 λ1=1,λ2=2,λ3=3\lambda_1=1,\lambda_2=2,\lambda_3=3. 即该3阶矩阵有3个不同的特征值,因此可知AA可对角化,即TT可对角化.

经典问题

可对角化求矩阵幂

已知A=(012121121211212)A=\begin{pmatrix} 0 & \dfrac{1}{2} & \dfrac{1}{2} \\[2ex] 1 & -\dfrac{1}{2} & \dfrac{1}{2} \\[2ex] 1 & -\dfrac{1}{2} & \dfrac{1}{2} \end{pmatrix},求AnA^n.

Answer

首先求出AA的特征多项式f(λ)=λEA=λ(λ1)(λ+1)f(\lambda)=|\lambda E-A|=\lambda(\lambda-1)(\lambda+1),令f(λ)=0f(\lambda)=0,解得特征值为 λ1=0,λ2=1,λ3=1\lambda_1=0,\lambda_2=1,\lambda_3=-1.

接下来求解特征向量和特征子空间,实际上就是求解(0EA)x=0,(EA)x=0,(EA)x=0(0E-A)x=0,(-E-A)x=0,(E-A)x=0,得到特征向量为

η1=(111),η2=(111),η3=(111).\eta_1=\begin{pmatrix} 1 \\ 1 \\ -1 \end{pmatrix},\enspace \eta_2=\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix},\enspace \eta_3=\begin{pmatrix} 1 \\ -1 \\ -1 \end{pmatrix}.

所以记P=(η1,η2,η3)P=(\eta_1,\eta_2,\eta_3),则A=Pdiag(0,1,1)P1A=P\mathbf{diag}(0,1,-1)P^{-1},因此

An=Pdiag(0n,1n,(1)n)P1 A^n=P\mathbf{diag}(0^n,1^n,(-1)^n)P^{-1}

进一步计算得到

An=12(1+(1)n(1)n+111+(1)n+1(1)n11+(1)n+1(1)n1).A^n=\frac{1}{2}\begin{pmatrix} 1+(-1)^n & (-1)^{n+1} & 1 \\ 1+(-1)^{n+1} & (-1)^n & 1 \\ 1+(-1)^{n+1} & (-1)^n & 1 \end{pmatrix}.

秩1矩阵可对角化条件

α\alphaβ\betaRn(n>1)\mathbf{R}^n\enspace (n>1)中两个列向量,A=αβTOA=\alpha\beta^\mathrm{T}\neq O.

  • AA的特征值;

  • 证明:αTβ=0    A\alpha^\mathrm{T}\beta=0\iff A不可对角化.

Answer
  • 我们知道,r(A)min{r(α),r(β)}=1r(A)\leqslant\min{\{r(\alpha),r(\beta)\}}=1,并且AOA\neq O因此r(A)>0r(A)>0,故AA的秩为1. 而n>1n>1,因此AA一定不可逆,故0一定是AA的特征值,且对应的特征子空间维数为AX=0AX=0的解空间维数,即为n1n-1.

由此我们知道AA最多有两个特征值,因为0的代数重数(即作为nn次特征多项式的零点次数)必然大于等于其几何重数n1n-1,当期代数重数为n1n-1时可能还有一个一重特征值. 我们利用特征值之和等于AA的迹来找出可能的第二个特征值. 我们设α=(a1,a2,,an)T,β=(b1,b2,,bn)T\alpha=(a_1,a_2,\ldots,a_n)^\mathrm{T},\beta=(b_1,b_2,\ldots,b_n)^\mathrm{T},则A=αβT=(a1b1a1b2a1bna2b1a2b2a2bnanb1anb2anbn)A=\alpha\beta^\mathrm{T}=\begin{pmatrix} a_1b_1 & a_1b_2 & \cdots & a_1b_n \\ a_2b_1 & a_2b_2 & \cdots & a_2b_n \\ \vdots & \vdots & \ddots & \vdots \\ a_nb_1 & a_nb_2 & \cdots & a_nb_n \end{pmatrix}, 因此AA的迹为i=1naibi=αTβ=i=1nλi\sum\limits_{i=1}^na_ib_i=\alpha^\mathrm{T}\beta=\sum\limits_{i=1}^n\lambda_i,其中λi\lambda_iAA的特征值. 若αTβ0\alpha^\mathrm{T}\beta\neq 0,则λi=0,i=1,,n1\lambda_i=0,\enspace i=1,\ldots,n-1λn=αTβ\lambda_n=\alpha^\mathrm{T}\beta. 若αTβ=0\alpha^\mathrm{T}\beta=0,则AA的所有特征值均为0.

  • 由上一小问可知,若αTβ=0\alpha^\mathrm{T}\beta=0AA的全部特征值为0,因此只有一个n1n-1维的特征子空间,故特征子空间直和不等于VV,故不可对角化.

反之,若AA不可对角化,我们用反证法. 假设αTβ0\alpha^\mathrm{T}\beta\neq 0,则AA有两个特征值,一个为0,一个为αTβ\alpha^\mathrm{T}\beta,因此AA有两个特征子空间,一个是0对应的n1n-1维特征子空间,一个是αTβ\alpha^\mathrm{T}\beta对应的一维特征子空间,因此VV可分解为两个特征子空间的直和,与AA不可对角化矛盾,因此αTβ=0\alpha^\mathrm{T}\beta=0.

幂零矩阵不可对角化

AAnn阶非零矩阵,且Am=O(mN+,m>1)A^m=O\enspace(m\in\mathbf{N}_+,\enspace m>1). 证明:AA不可对角化;

Answer

λ\lambdaAA的特征值,由题意λm=0\lambda^m=0,即λ=0\lambda=0,因此AA的所有特征值都为0. 但r(A)>0r(A)>0(因为AA不是零矩阵),因此0对应的特征子空间维数为nr(A)<nn-r(A)<n,因此AA不可对角化.

给出矩阵方程问对角化

  • AAnn阶矩阵,且A2=2AA^2=2A. 证明:AA可对角化,并求出与之相似的对角矩阵(注:本题结论可推广到任意的A2=kAA^2=kA);

  • AA为二阶矩阵,非零向量α\alpha不是AA的特征向量,且A2α3Aα+2α=0A^2\alpha-3A\alpha+2\alpha=0. 证明:α\alphaAαA\alpha线性无关且AA可对角化并求与AA相似的对角矩阵.

Answer

1. 由题意A22A=OA^2-2A=O,因此AA的特征值就是方程λ22λ=0\lambda^2-2\lambda=0的解,即λ1=0,λ2=2\lambda_1=0,\lambda_2=2.

接下来我们需要说明0和2对应的特征子空间维数之和为nn,即dimV0+dimV2=n\dim V_0+\dim V_2=n,其中V0V_0V2V_2分别为0和2对应的特征子空间. 事实上,由A2=2AA^2=2A可知A(A2E)=OA(A-2E)=O,由知r(A)+r(A2E)nr(A)+r(A-2E)\leqslant n,又根据秩不等式r(A)+r(B)r(A+B)r(A)+r(B)\geqslant r(A+B),因此r(A)+r(A2E)=r(A)+r(2EA)r(A+(2EA))=r(2E)=nr(A)+r(A-2E)=r(A)+r(2E-A)\geqslant r(A+(2E-A))=r(2E)=n. 综上可知,r(A)+r(A2E)=nr(A)+r(A-2E)=n.

实际上,V0V_0就是AX=0AX=0的解空间,V2V_2就是(A2E)X=0(A-2E)X=0的解空间,因此dimV0=nr(A),dimV2=nr(A2E)\dim V_0=n-r(A),\dim V_2=n-r(A-2E),因此由r(A)+r(A2E)=nr(A)+r(A-2E)=n可知dimV0+dimV2=2nn=n\dim V_0+\dim V_2=2n-n=n,即0和2对应的特征子空间维数之和为nn,因此AA可对角化.

由于可对角化矩阵代数重数等于几何重数,因此特征值0对应的代数重数为nr(A)n-r(A),特征值2对应的代数重数为r(A)r(A),因此我们可以得到与AA相似的对角矩阵为diag(0,,0,2,,2)\mathbf{diag}(0,\ldots,0,2,\ldots,2),其中0的个数为nr(A)n-r(A),2的个数为r(A)r(A).

2. 反证法,假设α\alphaAαA\alpha线性相关,则存在不全为零的常数k1,k2k_1,k_2使得k1α+k2Aα=0k_1\alpha+k_2A\alpha=0. 显然k20k_2\neq 0,因为假设k2=0k_2=0,则k1α=0k_1\alpha=0,由于α0\alpha\neq 0,故k1=0k_1=0,这与k1,k2k_1,k_2不全为0矛盾. 因此我们有Aα=k1k2αA\alpha=-\dfrac{k_1}{k_2}\alpha,即α\alphaAA的特征向量,这与题设矛盾,因此α\alphaAαA\alpha线性无关.

由题意,A2α3Aα+2α=0A^2\alpha-3A\alpha+2\alpha=0,即(A23A+2E)α=0(A^2-3A+2E)\alpha=0,又α0\alpha\neq 0,因此A23A+2EA^2-3A+2E不可逆,从而A23A+2E=EA2EA=0|A^2-3A+2E|=|E-A||2E-A|=0,故EA=0|E-A|=02EA=0|2E-A|=0.

EA0|E-A|\neq 0,则EAE-A可逆,因此(A23A+2E)α=(EA)((2EA)α)=0(A^2-3A+2E)\alpha=(E-A)((2E-A)\alpha)=0可知(2EA)α=0(2E-A)\alpha=0,即Aα=2αA\alpha=2\alpha,故α\alphaAA的特征向量,这与条件矛盾,因此EA=0|E-A|=0. 同理,2EA=0|2E-A|=0,因此AA有两个特征值1和2,又AA是2阶矩阵,因此由\autoref{cor:可对角化必要条件} 可知AA一定可对角化,且对角矩阵为(1002)\begin{pmatrix} 1 & 0 \\ 0 & 2 \end{pmatrix}.

若当矩阵不可对角化

证明rr阶上三角矩阵(r>1)(r>1)

J0=(λ01λ01λ0)J_0=\begin{pmatrix} \lambda_0 & 1 & & \\ & \lambda_0 & \ddots & \\ & & \ddots & 1 \\ & & & \lambda_0 \end{pmatrix}

不与对角阵相似.

Answer

首先求出特征多项式为f(λ)=λEJ0=(λλ0)rf(\lambda)=|\lambda E-J_0|=(\lambda-\lambda_0)^r,因此J0J_0只有一个特征值λ0\lambda_0,且代数重数为rr.

接下来求几何重数,即J0X=λ0XJ_0X=\lambda_0X的解空间维数,即(λ0EJ0)X=O(\lambda_0 E-J_0)X=O的解空间维数,事实上由于r(λ0EJ0)=r1r(\lambda_0 E-J_0)=r-1,因此解空间维数为r(r1)=1r-(r-1)=1,即几何重数为1<r1<r,因此不可对角化

AB=BA

A,BMn(F) A, B \in M_n(\mathbf{F}) , AB=BA AB = BA , 证明:

  1. X X 是矩阵 A A 属于特征值 λ0 \lambda_0 的特征向量,则 BXVλ0 BX \in V_{\lambda_0} .
  2. A A B B 至少有一个共同的特征向量.
  3. A A n n 个不同的特征值则
  4. AB=BA AB = BA 当且仅当 A A 的特征向量也是 B B 的特征向量.
  5. 存在次数小于等于 n1 n-1 的多项式 f(x) f(x) 使得 B=f(A) B = f(A) .
  6. A,B A, B 均可对角化,则对角化的过渡矩阵可以相同(同时对角化).
  7. A,B A, B 可以同时上三角化,即存在可逆矩阵 P P 使得 P1AP P^{-1}AP P1BP P^{-1}BP 都是上三角矩阵.

n n 阶方阵 A A B B 都可对角化,并且它们有相同的特征子空间(但不一定有相同的特征值),证明 AB=BA AB = BA .

习题

  • AA为n阶复方阵,PP为可逆矩阵。证明tr(A)=tr(P1AP)tr(A)=tr(P^{-1}AP)

  • 已知AA为3阶矩阵,特征值为1,2,3;求A2+4A+E|A^2+4A+E|

  • 证明:若A2(λ1+λ2)A+λ1λ2E=O,λ1λ2A^2-(\lambda_1+\lambda_2)A+\lambda_1 \lambda_2 E = O,\lambda_1 \neq \lambda_2,则AA可对角化(Hint:矩阵方程可对角化条件),并判断以下说法说法哪一个正确

    • AA的特征值兼有一定兼有λ1\lambda_1λ2\lambda_2
    • AA可对角化,但其特征值不一定同时有λ1\lambda_1λ2\lambda_2,可能为λ1\lambda_1λ1\lambda_1,λ2\lambda_2λ2\lambda_2,或者λ1\lambda_1λ2\lambda_2
  • 证明秩为1的向量可以写为αTβ\alpha^\mathrm{T}\beta,(回忆相抵标准型~)

  • α\alphann 维实向量且 αTα=1\alpha^\mathrm{T} \alpha =1,求矩阵IααTI-\alpha \alpha^\mathrm{T}的特征值(Hint: 特征多项式展开)

  • A,BA,B都是nn阶矩阵,证明AB+BAB+BBA+BBA+B有相同的特征值.(Hint:证明相似)

  • 判断并证明:nn阶方阵AA满足A25A+5En=0A^2-5A+5E_n=0,则对于所有的有理数rr,有A+rEnA+rE_n可逆

X={(a11a12a13a21a22a23a31a32a33)M3×3(R) | j=13a1j=j=13a2j=j=13a3j=i=13aij}. X = \left\{ \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix} \in M_{3 \times 3}(\mathbb{R}) \ \middle| \ \sum_{j=1}^{3} a_{1j} = \sum_{j=1}^{3} a_{2j} = \sum_{j=1}^{3} a_{3j} = \sum_{i=1}^{3} a_{ij} \right\}.

证明:

  1. XXM3×3(R)M_{3 \times 3}(\mathbb{R}) 的一个子空间,并求该子空间的维数;
  2. 对任意可逆矩阵 AXA \in X(1,1,1)T(1, 1, 1)^\mathrm{T}AAA1A^{-1} 的特征向量;
  3. 对任意可逆矩阵 AXA \in XA1XA^{-1} \in X