讲义-特征值专题
参考书目:《线性代数:未竟之美》
本讲义用于竺可桢学院线性代数线上辅学课程,奈何本人水平有限,有些地方在课程中可能表述不清晰,还请多多包涵。
引入
Quote
线性代数的一大目标是:我们希望找到出发空间和到达空间合适的基使得线性映射在这两组基下的表示更简单(尽可能多的零,尽量向对角矩阵靠近).我们将眼光放在线性变换,即出发空间和到达空间相同的线性映射,并且我们关注 出发空间与到达空间取同一组基的时候,如何取基,可以把同一个线性映射的矩阵尽可能表示得简单 ;
基的转换<->矩阵的转换
从矩阵在不同基下的的表示出发
假设我们有一个在 n 维线性空间 V 上线性变换 σ ,其在基 B={ε1,ε2,…,εn} (B 的每个列向量是都是一个基)下的矩阵为 A,即
σ(ε1,ε2,…,εn)=(ε1,ε2,…,εn)A
假设我们很幸运,找到了另外一组基 B′={ε1′,ε2′,…,εn′},并且已知这个线性映射在这组基下的矩阵很漂亮,是对角的Λ,即
σ(ε1′,ε2′,…,εn′)=(ε1′,ε2′,…,εn′)Λ
如果又恰好知道两组基之间的过渡矩阵
{ε1′,ε2′,…,εn′}={ε1,ε2,…,εn}P
那么我们可以推导出
AP=PΛ(1)
P−1AP=Λ
P为什么一定可逆?(基之间的互相表示)
继续由上面的式子(1),我们展开,pi为矩阵P的第i个列向量
AP=A(p1,p2,…,pn)=(p1,p2,…,pn)⎝⎛λ100⋮00λ20⋮000λ3⋮0⋯⋯⋯⋱⋯000⋮λn⎠⎞
展开对应相等
Api=λipi
Key-point
这一过程给我们的启发是,如果我们知道A可以达到的对角化的矩阵是怎么样的,那么可以逆推出变换矩阵,从而找出这组基是怎么样的;上面的λi,与pi就是我们今天要讨论的特征值与特征向量,如何寻找它们就是我们今天的重点;
特征值与特征向量
定义
Definition
设σ是线性空间V(F)上的一个线性变换,如果存在数λ∈F和非零向量ξ∈V使得σ(ξ)=λξ,则称数λ为σ的一个特征值,并称非零向量ξ为σ属于其特征值λ的特征向量
同构地,对于矩阵而言,有:
设矩阵A∈Mn(F),如果存在数λ∈F和非零向量X∈Fn使得AX=λX,则称数λ为A的一个特征值,称非零向量X为A属于其特征值λ的特征向量.
Property
设 σ 是 V(F) 上的线性变换,I 为恒等映射,则下述条件等价:
- λ∈F 是 σ 的特征值;
- σ−λI 不是单射 ⇔ A−λE 列不满秩;
- σ−λI 不是满射 ⇔ A−λE 行不满秩;
- σ−λI 不可逆 ⇔ A−λE 不可逆(行列式为0)
对于第二第三条的矩阵版本有疑问的同学可以回顾 LALU 相抵标准型一节给出的定理:
线性映射是单射当且仅当其矩阵表示为列满秩矩阵,线性映射是满射当且仅当其矩阵表示为行满秩矩阵.
特征多项式
由上述性质,λ∈F是σ的特征值等价于∣λE−A∣=0,故我们可以通过∣λE−A∣=0求解特征值,其中A为σ在某组基下的矩阵,E为单位矩阵. 对于特征向量的求解,求出(λE−A)X=0的非零解就是特征向量在基α1,…,αn下的坐标,如果是矩阵的特征向量,那么X就是解.
上述求解特征向量的方法需要我们求解f(λ)=∣λE−A∣的根,我们将f(λ)称为特征多项式;
Example
设A=⎝⎛121−10a010⎠⎞,且存在非零向量α使得Aα=2α,求a.
Answer
由题意知2是矩阵A的特征值,因此我们有
∣2E−A∣=∣∣1−2−112−a0−12∣∣=9−a=0
因此a=9.
特征多项式可以写为以下的形式
对于n级矩阵A=(aij),记
f(λ)=∣λE−A∣=a0λn+a1λn−1+⋯+an−1λ+an
则a0=1,a1=−tr(A) ,an=(−1)n∣A∣ ,且ak等于所有k级主子式之和乘以(−1)k.
由韦达定理
一元n次韦达定理
设方程 a0xn+a1xn−1+⋯+an−1x+an=0 有根 x1,x2,…,xn. 那么:
x1+x2+⋯+xn=i=1∑nxi=−a0a1
x1x2⋯xn=i=1∏nxi=(−1)na0an
相似与特征多项式
Question
- 相似矩阵有相同的特征多项式?(从而有相同的迹,行列式,特征值;),即A∼B有∣λE−A∣=∣λE−B∣吗?反过来呢?
Answer
设B=P−1AP,则∣λE−B∣=∣λE−P−1AP∣=∣P−1(λE−A)P∣=∣P−1∣∣λE−A∣∣P∣=∣λE−A∣. 因此A∼B有∣λE−A∣=∣λE−B∣.
我们知道特征多项式相同则特征值相同,迹等于所有特征值之和,行列式等于所有特征值之积,因此相似矩阵有相同的迹,行列式,特征值.
Answer
设P−1AP=B,则A,B分别属于同一特征值λ的特征向量X和Y满足Y=P−1X.
由AX=λ0X以及A=PBP−1,我们有PBP−1X=λ0X,即BP−1X=λ0P−1X,因此P−1X是B属于λ0的特征向量,即P−1X是B的特征向量,即Y=P−1X.
回忆基的选择导致同一向量在不同基下的坐标表示,实际上这个问题就是该定理的推论;
同一向量在不同基下的坐标表示
设线性空间V的两组基为B1和B2,且基B1到B2的变换矩阵(过渡矩阵)为A,如果ξ∈V(F)在B1和B2下的坐标分别为X和Y,则Y=A−1X.
ξ=(α1,…,αn)X=(β1,…,βn)Y.
将过渡矩阵的条件B2=B1A,即(β1,…,βn)=(α1,…,αn)A代入上式可得:
ξ=(α1,…,αn)X=(α1,…,αn)AY.
又由于ξ在线性无关向量组α1,…,αn下的坐标唯一,故我们有X=AY,即Y=A−1X.
Example
回答以下两个问题:
-
设 A,B 均为 n 阶矩阵,证明:λ=0 是 AB 的特征值,则 λ 也是 BA 的特征值;
-
设 A∈Mm×n(C),B∈Mn×m(C),证明:
(ABBOO)∼(OBOBA)
并由此推出 AB 和 BA 非零特征值相同,且 m=n 时有 ∣λE−AB∣=∣λE−BA∣.
Proof
- 设 X 是 AB 属于 λ 的特征向量,则 ABX=λX,因此 B(ABX)=B(λX),即 (BA)(BX)=λ(BX),因此 BX 是 BA 属于 λ 的特征向量,故 λ 也是 BA 的特征值。
实际上这里还有一点需要说明,就是 BX=0,否则它将不能作为特征向量。事实上证明是简单的,假设 BX=0,则 ABX=0,由于 λ=0,因此必然有 X=0,但这与 X 是 AB 属于 λ 的特征向量矛盾,因此 BX=0。
- 根据分块矩阵初等变换的性质,我们可以通过不断尝试选取到 P=(EmOAEn),其逆矩阵为 P−1=(EmO−AEn),我们发现恰有
(EmO−AEn)(ABBOO)(EmOAEn)=(OBOBA).
因此 (ABBOO) 与 (OBOBA) 相似,因此它们的特征多项式相同,即
∣∣λEm−AB−BOλEn∣∣=∣∣λEm−BOλEn−BA∣∣.
根据行列式的计算性质 ∣∣ACOB∣∣=∣A∣∣B∣,我们有
∣λEm−AB∣∣λEn∣=∣λEm∣∣λEn−BA∣,
即 λn∣λEm−AB∣=λm∣λEn−BA∣,因此 AB 和 BA 非零特征值相同,且 m=n 时有 ∣λE−AB∣=∣λE−BA∣.
对于可逆矩阵P,我们知道了A与B=P−1AP有相同的特征值,如果P不可逆,两个矩阵又有什么关系呢?
我们有以下结论
Property
设A,B分别为数域F上n阶、m阶方阵,A,B有r个两两不等的公共特征值,则矩阵方程AX−XB=O有秩为r的矩阵解. 反之,若数域为复数域,矩阵方程AX−XB=O有秩为r的矩阵解,则A,B至少有r个公共的特征值(计重数).
证明见 《LALU》.P465
Example
设m阶矩阵A与n阶矩阵B无公共复特征值,C为m×n矩阵,则矩阵方程AX−XB=C存在唯一解.
Answer
设V是所有m×n矩阵构成的线性空间,定义V上的线性变换σ(X)=AX−XB,X∈V. 由于A和B无公共复特征值,所以σ(X)=AX−XB=O只有零解,即σ为V上单射,可知σ是满射且是同构映射. 于是,对任意的C∈V,都存在唯一的X0∈V使得σ(X0)=C,即矩阵方程AX−XB=C存在唯一解X0.
特征值的性质与结论
-
设λ是线性空间V(F)上的线性变换σ的特征值,ξ是σ属于λ的特征向量,则
-
kλ是kσ的特征值,λm是σm的特征值,且ξ仍是相应特征向量;
-
若f(x)=anxn+an−1xn−1+⋯+a1x+a0是F上的多项式,则f(σ)(ξ)=f(λ)ξ;
-
设λ是n阶矩阵A的特征值,A可逆,则λ−1是A−1的特征值,∣A∣λ−1是A的伴随矩阵A∗的特征值,且特征向量不变.
-
设A为n阶矩阵,则A与AT有相同的特征值(含重数).
-
A可逆/A不可逆/E+A可逆/4E+A不可逆;
-
∣E−A2∣=0;
-
A2=E(对合)/A2=A(幂等)/Ak=0(幂零);
-
A=λ0E+B(λ0为常数,且已知B的n个特征值为λ1,λ2,…,λn);
-
A为对角块矩阵,即A=diag(A1,A2,…,Am).
Proof
1
由于σ(ξ)=λξ,则(kσ)(ξ)=kλξ,即kλ是kσ的特征值,ξ仍是相应特征向量。
而σm(ξ)=σm−1(σ(ξ))=σm−1(λξ)=λσm−1(ξ)=⋯=λmξ,即λm是σm的特征值,ξ仍是相应特征向量。
2
利用前述σm的相关性质,我们有
f(σ)(ξ)=(anσn+an−1σn−1+⋯+a1σ+a0I)(ξ)
=anσn(ξ)+an−1σn−1(ξ)+⋯+a1σ(ξ)+a0I(ξ)
=anλnξ+an−1λn−1ξ+⋯+a1λξ+a0ξ
=f(λ)ξ.
3
设ξ是A的特征值,即Aξ=λξ,则ξ=A−1Aξ=A−1λξ,即A−1ξ=λ−1ξ,因此λ−1是A−1的特征值,ξ仍是相应特征向量。
又由于A可逆时A∗=∣A∣A−1,根据前面关于kσ和A−1特征值的讨论可知,∣A∣λ−1是A的伴随矩阵A∗的特征值,ξ仍是相应特征向量。
4
我们用特征多项式证明。实际情况是,AT的特征多项式为∣λE−AT∣=∣(λE−A)T∣=∣λE−A∣(回忆转置不改变行列式),实际上与A的特征多项式完全一致,因此AT与A有相同的特征值(含重数)。
5
A可逆时有 ∣A∣=λ1⋯λn=0,因此A的特征值都不为0。 同理,A不可逆同理表明存在特征值等于0,E+A可逆表明−1不是A的特征值,4E+A不可逆表明−4是A的特征值。
6
∣E−A2∣=∣E−A∣∣E+A∣=0,因此±1都是A的特征值。
7
我们首先考虑对合矩阵,接下来的同理可以得到类似结论。由于A2=E,设AX=λX,则A2X=λ2X=X,因此λ2=1,即λ=±1,因此1或−1是A的特征值。
注:本题解决过程中告诉我们一个解题技巧,如果看到A的多项式f(A)=O这种形式的表达式,事实上A的特征值只能是f(λ)=0的根,如上题中f(A)=A2−E,则f(λ)=λ2−1,因此A的特征值只能是±1。
同理,我们可以知道幂等矩阵的特征值只能是0和1,幂零矩阵的特征值只能是0(这是一个重要的幂零矩阵等价条件,未来我们会再次遇到)。
8
设 BX=λiXi (Xi=0,i=1,…,n),则
AXi=λ0Xi+BXi=λ0Xi+λiXi=(λ0+λi)Xi
因此λ0+λi (i=1,…,n)都是A的特征值。
9
证明:
∣λE−A∣=∣∣λE1−A10⋮00λE2−A2⋮0⋯⋯⋱⋯00⋮λEm−Am∣∣=i=1∏m∣λEi−Ai∣=0
因此,Ai,i=1,…,m的特征值都是A的特征值。
Example
-
设α=(1,0,−1)T,且A=ααT,求∣6E−An∣;
-
设A为三阶矩阵,其特征值为1,−2,−1,求∣A∣,A∗+3E的特征值,(A−1)2+2E的特征值以及∣A2−A+E∣;
-
设A为三阶矩阵,A2−A−2E=O,∣A∣=2,求∣A∗+3E∣;
-
设A为三阶矩阵,其特征值为−1,−1,5,求A11+A22+A33;
Answer
-
事实上A=ααT=⎝⎛10−1000−101⎠⎞,由∣λE−A∣=0解得A的特征值为λ1=λ2=0,λ3=2,而根据An的特征值性质可知,6E−An的特征值为6−λ1n,6−λ2n,6−λ3n,即6,6,6−2n,因此∣6E−An∣=62(6−2n)=36(6−2n).
-
由于A的特征值为1,−2,−1,因此∣A∣=1×(−2)×(−1)=2,而A∗的特征值为∣A∣λ−1,因此A∗的特征值为2,−1,−2,故A∗+3E的特征值为A∗的特征值加3(即为5,2,1,又根据A−1和A2特征值的性质可知,(A−1)2+2E的特征值为12+2,(−1/2)2+2,(−1)2+2,即为3,9/4,3,而A2−A+E的特征值根据f(σ)特征值性质的讨论可知为12−1+1,(−2)2−(−2)+1,(−1)2−(−1)+1,即为1,7,3,因此∣A2−A+E∣=1×7×3=21.
-
设AX=λX(X=0),则(A2−A−2E)X=(λ2−λ−2)X=O,因此λ=−1或λ=2,根据对合矩阵的讨论可知,A的特征值恰为-1和2. 又∣A∣=2,且A为3阶矩阵,因此A的3个特征值必为-1,-1,2.
又A∗的特征值为∣A∣λ−1,因此A∗的特征值为1,−2,−2,A∗+3E的特征值为A∗的特征值加3,即λ1=λ2=1,λ3=4,故∣A∗+3E∣=λ1λ2λ3=4.
- 由题意知∣A∣=5,故A∗的特征值为∣A∣λ−1即为μ1=μ2=−5,μ3=1,而A11+A22+A33就是A∗的迹(即矩阵对角线元素之和),因此A11+A22+A33=μ1+μ2+μ3=−9.
特征向量与特征子空间的性质
-
σ的不同特征值对应的特征向量线性无关;
-
σ的不同特征值对应的特征子空间的和为直和;
-
σ最多有dimV个不同的特征值.
有以下推论
Proof
- 设 λ1,…,λm 是 σ 的互异特征值,ξ1,…,ξm 是相应的特征向量。反证法,我们假设 ξ1,…,ξm 线性相关,由线性相关性引理可知,存在 k 是使得
ξk∈spa(ξ1,…,ξk−1)
成立的最小整数,则存在 c1,…,ck−1 使得
ξk=c1ξ1+⋯+ck−1ξk−1.
将 σ 作用到上式两边,我们有
λkξk=c1λ1ξ1+⋯+ck−1λk−1ξk−1.
将上式两边乘以 λk,然后减去上式,我们有
0=c1(λk−λ1)ξ1+⋯+ck−1(λk−λk−1)ξk−1.
由于我们选取的 k 是满足 ξk∈spa(ξ1,…,ξk−1) 的最小整数,因此 ξ1,…,ξk−1 线性无关,故 c1=⋯=ck−1=0,因此 ξk=0,这与 ξk 是特征向量矛盾,因此 ξ1,…,ξm 线性无关。
- 回忆直和的证明方法,我们选取合适等价命题进行证明。假设
ξ1+⋯+ξm=0,
其中 ξi∈Vλi,由于 σ 的不同特征值对应的特征向量线性无关,因此 ξ1,…,ξm 不可能是特征向量,否则可知它们线性相关,故必有 ξ1=⋯=ξm=0,这表明 σ 的不同特征值对应的特征子空间的和为直和。
- 设 λ1,…,λm 是 σ 的互异特征值,ξ1,…,ξm 是相应的特征向量。前面已经证明了 ξ1,…,ξm 线性无关,因此 dimV⩾m,得证。
-
若λ1,…,λm是线性映射σ互异的特征值,则Vλi∩j=i∑Vλj={0}(i=1,…,m),则一个特征向量不能属于多个特征值.
-
σ的不同特征值λ1,…,λm对应的特征子空间Vλ1,…,Vλm的基向量合在一起构成的向量组线性无关,且是Vλ1+Vλ2+⋯+Vλm的基.
Definition
- 代数重数:某一特征值λ的代数重数指重根的个数;
- 几何重数:某一特征值的几何重数指特征向量生成线性空间的维数
若λ是σ的特征值,则λ的代数重数大于等于几何重数
我们思考,如果所有的特征子空间已经是全空间V,那么是否所有向量都是特征向量呢?下面的例子告诉我们不是这样的,事实上,只有当特征值唯一的时候,这个结论才正确:
2013-2014期末
设 V(F) 是 n 维线性空间,σ∈L(V),证明:
- 若 α,β 是 σ 的属于不同特征值的特征向量,则 c1c2=0 时,c1α+c2β 不是 σ 的特征向量;
- V 中的每一非零向量都是 σ 的特征向量 ⟺σ=c0IV,其中 c0∈F 是一个常数,IV 是恒等变换。
Proof
-
设 σ(α)=λ1α,σ(β)=λ2β,其中 λ1=λ2,并假设 c1α+c2β 是 σ 的特征向量,即存在 λ0∈F 使得
σ(c1α+c2β)=λ0(c1α+c2β).
展开括号,我们有
c1σ(α)+c2σ(β)=c1λ0α+c2λ0β.
即
c1λ1α+c2λ2β=c1λ0α+c2λ0β,
即
(λ1−λ0)c1α+(λ2−λ0)c2β=0.
由于 α,β 线性无关,因此
c1(λ1−λ0)=c2(λ2−λ0)=0.
当 c1c2=0 时,我们有 λ1=λ0=λ2,这与 λ1=λ2 矛盾,因此 c1α+c2β 不是 σ 的特征向量。
-
右推左显然,我们只考虑左推右的证明。由上一小问结论可知,若 V 中的每一非零向量都是 σ 的特征向量,σ 不可能有不同的特征值(因为有不同的特征值就有不同特征值对应的特征向量,但它们的线性组合一定仍在 V 中,这与从第一问中得到的结论,即它不是 σ 的特征向量矛盾)。设 c0 是 σ 的唯一的特征值,则对于任意 α∈V,我们有 σ(α)=c0α,即 σ 在任意元素上的像都已经唯一确定,则显然在 V 的一组基上的像也唯一确定,由线性映射唯一确定的定理可知这样的线性映射是唯一的,σ=c0IV 符合要求,因此它就是我们要找的线性映射。
Example
设 A 是数域 F 上一个 n 阶方阵,E 是 n 阶单位矩阵,α1∈Fn 是 A 的属于特征值 λ 的一个特征向量,向量组 α1,α2,…,αs 按如下方式产生:
(A−λE)αi+1=αi,i=1,2,…,s−1.
证明向量组 {α1,α2,…,αs} 线性无关。
Proof
由于 α1 是 A 属于特征值 λ 的特征向量,故有 (A−λE)α1=0。
设
i=1∑skiαi=0,
两边同时左乘 (A−λE) 可得
(A−λE)i=1∑skiαi=i=1∑ski(A−λE)αi=k1(A−λE)α1+i=1∑s−1ki+1αi=i=1∑s−1ki+1αi=0.
以此类推,在等式两边不断左乘 (A−λE) 可得:对于 ∀r∈{1,⋯,s−1} 都有
i=1∑s−rki+rαi=0.
令 r=s−1 得到 ksα1=0,ks=0。再依次代回不难得到 ki=0,∀i∈{1,⋯,s},从而向量组 α1,⋯,αs 线性无关。
可对角化的条件
可对角化
设σ∈L(V),如果存在V的一组基使得σ在这组基下的矩阵是对角矩阵,则称σ可对角化.
设V是数域F上的n维线性空间,σ是V上的线性变换,λ1,λ2,…,λs∈F是σ的所有互异特征值,则以下条件等价:
- σ 可对角化;
- σ 有 n 个线性无关的特征向量,它们构成 V 的一组基;
- V 有在 σ 下不变的一维子空间 U1,…,Un,使得 V=U1⊕⋯⊕Un;
- V=Vλ1⊕Vλ2⊕⋯⊕Vλs;
- n=dimVλ1+dimVλ2+⋯+dimVλs;
- σ 每个特征值的代数重数等于几何重数。
有推论
若 n 阶矩阵 A 有 n 个不同的特征值,则 A 可对角化. 反之,A 可对角化不一定有 n 个特征值.
Key-point
总结而言,只要特征子空间可以张成整个空间,那么这个线性变换就是可对角化的。
对角化的基本步骤
- 先任意写出 σ 在一组基 B 下的矩阵 A,当然为了计算方便一般选取自然基;
- 利用特征多项式 f(λ)=∣λE−A∣=0 求出 A 的所有不同特征值;
- 解线性方程组 AX=λX(实际上就是方程组 (λE−A)X=0,其中 λ 是上一步求
出的特征值)求出 A 在不同特征值下的线性无关特征向量;
- 第三步中求得的所有向量就是 λ 的特征向量在基 B 下的坐标,根据前面的讨论,σ
的特征向量也就是使得 σ 的矩阵表示为对角矩阵的那组基.
- 当然,如果题目中直接给出求 P 使得 P−1AP 为对角矩阵,那么我们只需进行 2、3
两步,并将 3 中得到的向量按列排列成矩阵 P 即可
6.如果要求P是正交矩阵,那么3中求出来的所有向量需要在 各自的特征子空间中正交化 。
Example
求矩阵
A=⎝⎛0−11−101110⎠⎞
的所有特征值,对应的特征子空间,以及与 A 相似的一个对角矩阵.
Answer
对于求解矩阵的对角化问题,首先求出其特征多项式(具体步骤不展开,实际上就是三阶行列式的计算,可以使用按行(列)展开、公式法或者初等变换化为三角矩阵等方法)f(λ)=∣λE−A∣=(λ−1)2(λ+2),令f(λ)=0,解得特征值为 λ1=λ2=1,λ3=−2.
接下来求解特征向量和特征子空间,即求解(E−A)x=0和解(−2E−A)x=0,得到特征值1对应的特征子空间为spa((−1,1,0)T,(1,0,1)T),特征值-2对应的特征子空间为spa((−1,−1,1)T).
与A相似的对角矩阵实际上就是特征值排列在对角线上的结果,即 diag(1,1,−2).
Example
设 T 是次数小于等于 2 的实多项式线性空间 V 上的变换,对任意 f(x)∈V,定义
T(f(x))=dxd((x−2)f(x))
证明 T 是 V 上的线性变换,且T可对角化.
Answer
首先证明这是线性变换. 首先验证线性性,对于任意f(x),g(x)∈V,a,b∈R,我们有
T(af(x)+bg(x))=dxd((x−2)(af(x)+bg(x)))=dxd(axf(x)−2af(x)+bxg(x)−2bg(x))=adxd((x−2)f(x))+bdxd((x−2)g(x))=aT(f(x))+bT(g(x)).
然后说明这是V上的线性变换,即该映射的到达空间是V,即T(f(x))∈V, 因为f(x)是次数小于等于2的实多项式,设f(x)=ax2+bx+c,则
T(f(x))=dxd((x−2)(ax2+bx+c))=dxd(ax3+(b−2a)x2+(c−2b)x−2c)=3ax2+2(b−2a)x+(c−2b)∈V.
因此T是V上的线性变换.
下面我们来判断T是否可对角化. 线性变换的可对角化问题第一步要转化为任意一组基下的矩阵,然后判断矩阵是否可对角化,因此我们先任意选取一组基,为方便我们选取自然基{1,x,x2},然后求出T在这组基下的矩阵A=⎝⎛100−2200−43⎠⎞,然后求出其特征多项式f(λ)=∣λE−A∣=(λ−1)(λ−2)(λ−3),令f(λ)=0,解得特征值为 λ1=1,λ2=2,λ3=3. 即该3阶矩阵有3个不同的特征值,因此可知A可对角化,即T可对角化.
经典问题
可对角化求矩阵幂
已知A=⎝⎛01121−21−21212121⎠⎞,求An.
Answer
首先求出A的特征多项式f(λ)=∣λE−A∣=λ(λ−1)(λ+1),令f(λ)=0,解得特征值为 λ1=0,λ2=1,λ3=−1.
接下来求解特征向量和特征子空间,实际上就是求解(0E−A)x=0,(−E−A)x=0,(E−A)x=0,得到特征向量为
η1=⎝⎛11−1⎠⎞,η2=⎝⎛111⎠⎞,η3=⎝⎛1−1−1⎠⎞.
所以记P=(η1,η2,η3),则A=Pdiag(0,1,−1)P−1,因此
An=Pdiag(0n,1n,(−1)n)P−1
进一步计算得到
An=21⎝⎛1+(−1)n1+(−1)n+11+(−1)n+1(−1)n+1(−1)n(−1)n111⎠⎞.
秩1矩阵可对角化条件
设α和β是Rn(n>1)中两个列向量,A=αβT=O.
Answer
- 我们知道,r(A)⩽min{r(α),r(β)}=1,并且A=O因此r(A)>0,故A的秩为1. 而n>1,因此A一定不可逆,故0一定是A的特征值,且对应的特征子空间维数为AX=0的解空间维数,即为n−1.
由此我们知道A最多有两个特征值,因为0的代数重数(即作为n次特征多项式的零点次数)必然大于等于其几何重数n−1,当期代数重数为n−1时可能还有一个一重特征值. 我们利用特征值之和等于A的迹来找出可能的第二个特征值. 我们设α=(a1,a2,…,an)T,β=(b1,b2,…,bn)T,则A=αβT=⎝⎛a1b1a2b1⋮anb1a1b2a2b2⋮anb2⋯⋯⋱⋯a1bna2bn⋮anbn⎠⎞,
因此A的迹为i=1∑naibi=αTβ=i=1∑nλi,其中λi为A的特征值. 若αTβ=0,则λi=0,i=1,…,n−1,λn=αTβ. 若αTβ=0,则A的所有特征值均为0.
- 由上一小问可知,若αTβ=0即A的全部特征值为0,因此只有一个n−1维的特征子空间,故特征子空间直和不等于V,故不可对角化.
反之,若A不可对角化,我们用反证法. 假设αTβ=0,则A有两个特征值,一个为0,一个为αTβ,因此A有两个特征子空间,一个是0对应的n−1维特征子空间,一个是αTβ对应的一维特征子空间,因此V可分解为两个特征子空间的直和,与A不可对角化矛盾,因此αTβ=0.
幂零矩阵不可对角化
设A为n阶非零矩阵,且Am=O(m∈N+,m>1). 证明:A不可对角化;
Answer
设λ是A的特征值,由题意λm=0,即λ=0,因此A的所有特征值都为0. 但r(A)>0(因为A不是零矩阵),因此0对应的特征子空间维数为n−r(A)<n,因此A不可对角化.
给出矩阵方程问对角化
-
设A为n阶矩阵,且A2=2A. 证明:A可对角化,并求出与之相似的对角矩阵(注:本题结论可推广到任意的A2=kA);
-
设A为二阶矩阵,非零向量α不是A的特征向量,且A2α−3Aα+2α=0. 证明:α和Aα线性无关且A可对角化并求与A相似的对角矩阵.
Answer
1.
由题意A2−2A=O,因此A的特征值就是方程λ2−2λ=0的解,即λ1=0,λ2=2.
接下来我们需要说明0和2对应的特征子空间维数之和为n,即dimV0+dimV2=n,其中V0和V2分别为0和2对应的特征子空间. 事实上,由A2=2A可知A(A−2E)=O,由知r(A)+r(A−2E)⩽n,又根据秩不等式r(A)+r(B)⩾r(A+B),因此r(A)+r(A−2E)=r(A)+r(2E−A)⩾r(A+(2E−A))=r(2E)=n. 综上可知,r(A)+r(A−2E)=n.
实际上,V0就是AX=0的解空间,V2就是(A−2E)X=0的解空间,因此dimV0=n−r(A),dimV2=n−r(A−2E),因此由r(A)+r(A−2E)=n可知dimV0+dimV2=2n−n=n,即0和2对应的特征子空间维数之和为n,因此A可对角化.
由于可对角化矩阵代数重数等于几何重数,因此特征值0对应的代数重数为n−r(A),特征值2对应的代数重数为r(A),因此我们可以得到与A相似的对角矩阵为diag(0,…,0,2,…,2),其中0的个数为n−r(A),2的个数为r(A).
2.
反证法,假设α和Aα线性相关,则存在不全为零的常数k1,k2使得k1α+k2Aα=0. 显然k2=0,因为假设k2=0,则k1α=0,由于α=0,故k1=0,这与k1,k2不全为0矛盾. 因此我们有Aα=−k2k1α,即α是A的特征向量,这与题设矛盾,因此α和Aα线性无关.
由题意,A2α−3Aα+2α=0,即(A2−3A+2E)α=0,又α=0,因此A2−3A+2E不可逆,从而∣A2−3A+2E∣=∣E−A∣∣2E−A∣=0,故∣E−A∣=0或∣2E−A∣=0.
若∣E−A∣=0,则E−A可逆,因此(A2−3A+2E)α=(E−A)((2E−A)α)=0可知(2E−A)α=0,即Aα=2α,故α为A的特征向量,这与条件矛盾,因此∣E−A∣=0. 同理,∣2E−A∣=0,因此A有两个特征值1和2,又A是2阶矩阵,因此由\autoref{cor:可对角化必要条件} 可知A一定可对角化,且对角矩阵为(1002).
若当矩阵不可对角化
证明r阶上三角矩阵(r>1)
J0=⎝⎛λ01λ0⋱⋱1λ0⎠⎞
不与对角阵相似.
Answer
首先求出特征多项式为f(λ)=∣λE−J0∣=(λ−λ0)r,因此J0只有一个特征值λ0,且代数重数为r.
接下来求几何重数,即J0X=λ0X的解空间维数,即(λ0E−J0)X=O的解空间维数,事实上由于r(λ0E−J0)=r−1,因此解空间维数为r−(r−1)=1,即几何重数为1<r,因此不可对角化
AB=BA
设 A,B∈Mn(F), AB=BA, 证明:
- 若 X 是矩阵 A 属于特征值 λ0 的特征向量,则 BX∈Vλ0.
- A 和 B 至少有一个共同的特征向量.
- A 有 n 个不同的特征值则
- AB=BA 当且仅当 A 的特征向量也是 B 的特征向量.
- 存在次数小于等于 n−1 的多项式 f(x) 使得 B=f(A).
- 若 A,B 均可对角化,则对角化的过渡矩阵可以相同(同时对角化).
- A,B 可以同时上三角化,即存在可逆矩阵 P 使得 P−1AP 和 P−1BP 都是上三角矩阵.
设 n 阶方阵 A 和 B 都可对角化,并且它们有相同的特征子空间(但不一定有相同的特征值),证明 AB=BA.
习题
-
设A为n阶复方阵,P为可逆矩阵。证明tr(A)=tr(P−1AP)
-
已知A为3阶矩阵,特征值为1,2,3;求∣A2+4A+E∣
-
证明:若A2−(λ1+λ2)A+λ1λ2E=O,λ1=λ2,则A可对角化(Hint:矩阵方程可对角化条件),并判断以下说法说法哪一个正确
- A的特征值兼有一定兼有λ1和λ2
- A可对角化,但其特征值不一定同时有λ1和λ2,可能为λ1和λ1,λ2和λ2,或者λ1和λ2
-
证明秩为1的向量可以写为αTβ,(回忆相抵标准型~)
-
设 α 为 n 维实向量且 αTα=1,求矩阵I−ααT的特征值(Hint: 特征多项式展开)
-
A,B都是n阶矩阵,证明AB+B与BA+B有相同的特征值.(Hint:证明相似)
-
判断并证明:n阶方阵A满足A2−5A+5En=0,则对于所有的有理数r,有A+rEn可逆
-
记
X=⎩⎨⎧⎝⎛a11a21a31a12a22a32a13a23a33⎠⎞∈M3×3(R) ∣∣ j=1∑3a1j=j=1∑3a2j=j=1∑3a3j=i=1∑3aij⎭⎬⎫.
证明:
- X 是 M3×3(R) 的一个子空间,并求该子空间的维数;
- 对任意可逆矩阵 A∈X,(1,1,1)T 是 A 和 A−1 的特征向量;
- 对任意可逆矩阵 A∈X,A−1∈X。