LA@特征值和特征向量
文章目录
- 特征值和特征向量
- 例
- 例
- 求解方阵的特征值和特征向量🎈
- 特征多项式@特征方程
- 方阵特征值和特征向量的性质
- 证明
- 推论
- 衍生特征值
- 更一般的
- 转置和特征值
- 其他结论(方阵多项式的特征值与方阵本身特征值的关系)
- 特征向量线性相关性
特征值和特征向量
-
许多定量分析模型中,常常需要寻求数λ\lambdaλ和非零向量α\alphaα,使得Aα=λαA\alpha=\lambda\alphaAα=λα
-
一般特征值和特征向量是成对存在的,在概念上,是不可分割且相互依赖地同时定义出来
-
设A是n阶方阵
-
如果存在数λ\lambdaλ和n维非零列向量α(α≠0)\alpha(\alpha\neq{0})α(α=0),满足
-
Aα=λα或(λα−Aα=0;(λE−A)α=0)A\alpha=\lambda\alpha \\或(\lambda\alpha-A\alpha=0;(\lambda{E}-A)\alpha=0) Aα=λα或(λα−Aα=0;(λE−A)α=0)
-
称λ\lambdaλ是方阵A的一个特征值
-
α\alphaα为方阵A的对应于λ\lambdaλ的一个特征向量
-
-
-
特征值问题是对方阵而言的,如果说矩阵的特征值或特征向量,那么这个矩阵默认是方阵
例
(3122)(11)=(44)=4(11)\begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} \begin{pmatrix} 1\\ 1 \end{pmatrix} =\begin{pmatrix} 4 \\ 4 \end{pmatrix} =4\begin{pmatrix} 1 \\ 1 \end{pmatrix} (3212)(11)=(44)=4(11)
-
上述等式链告诉我们,矩阵
-
A=(3122)作用在向量α=(11)上的效果和常数4作用在α上的效果在乘法上是一样的A=\begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} 作用在向量\alpha=\begin{pmatrix} 1\\ 1 \end{pmatrix} \\上的效果和常数4作用在\alpha上的效果在乘法上是一样的 A=(3212)作用在向量α=(11)上的效果和常数4作用在α上的效果在乘法上是一样的
- 也就是说,矩阵左乘特征向量的结果和特征向量左乘特征向量的结果一样
-
例
-
设A2=AA^2=AA2=A,证明A的特征值为0或1
-
Aα=λαA2α=A(Aα)=Aλα=λ(Aα)=λ(λα)=λ2α又A2=A;A2α=Aα=λαA\alpha=\lambda{\alpha} \\A^2\alpha=A(A\alpha)=A\lambda\alpha=\lambda{(A\alpha)}=\lambda(\lambda\alpha)=\lambda^2\alpha \\又A^2=A;A^2\alpha=A\alpha=\lambda\alpha Aα=λαA2α=A(Aα)=Aλα=λ(Aα)=λ(λα)=λ2α又A2=A;A2α=Aα=λα
-
∴λ2α=λα(λ2−λ)α=0,α≠0λ2−λ=λ(λ−1)=0λ=0或1\\\therefore \lambda^2\alpha=\lambda\alpha \\(\lambda^2-\lambda)\alpha=\bold{0},\alpha\neq\bold0 \\\lambda^2-\lambda=\lambda(\lambda-1)=0 \\\lambda=0或1 ∴λ2α=λα(λ2−λ)α=0,α=0λ2−λ=λ(λ−1)=0λ=0或1
-
-
方法2:
-
同时对Aα=λα左乘A:A2α=λ(Aα)Aα=λ2αλα=λ2α同时对A\alpha=\lambda\alpha左乘A: \\A^2\alpha=\lambda(A\alpha) \\A\alpha=\lambda^{2}\alpha \\\lambda\alpha=\lambda^2{\alpha} 同时对Aα=λα左乘A:A2α=λ(Aα)Aα=λ2αλα=λ2α
-
其余和方法1一致
-
求解方阵的特征值和特征向量🎈
-
对于方程组S
(λE−A)α=0;α≠0(\lambda{E}-A)\alpha=\bold0;\alpha\neq{\bold0} (λE−A)α=0;α=0- 由于α≠0由于\alpha\neq{\bold0}由于α=0,所以α\alphaα是齐次线性方程组(λE−A)x=0(\lambda{E}-A)x=\bold0(λE−A)x=0的非零解
- 而上述齐次线性方程组有非零解,仅当其系数行列式为0
- 即矩阵A的特征值λ\lambdaλ是方程∣λE−A∣=0|\lambda{E}-A|=0∣λE−A∣=0的根
- 如果A是一个n阶方阵,则A在复数范围内恰有n个特征值(包括重根)
- 即使矩阵A的元素全为实数,其特征值也可能是复数
特征多项式@特征方程
-
设n阶方阵A=(aij)A=(a_{ij})A=(aij)
-
f(λ)=∣λE−A∣=∣λ−a11−a12⋯−a1n−a21λ−a22⋯−a2n⋮⋮⋮−an1−an2⋯λ−ann∣f(\lambda)=|\lambda{E}-A|= \begin{vmatrix} \lambda-a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& \lambda-a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&\lambda-a_{nn} \\ \end{vmatrix} f(λ)=∣λE−A∣=λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋯−a1n−a2n⋮λ−ann
-
−A=(−a11−a12⋯−a1n−a21−a22⋯−a2n⋮⋮⋮−an1−an2⋯−ann)λE=(λ0⋯00λ⋯0⋮⋮⋮00⋯λ)-A=\begin{pmatrix} -a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& -a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&-a_{nn} \\ \end{pmatrix} \\ \lambda{E}= \begin{pmatrix} \lambda& 0& \cdots&0 \\ 0& \lambda& \cdots&0 \\ \vdots& \vdots& &\vdots \\ 0& 0& \cdots&\lambda \\ \end{pmatrix} −A=−a11−a21⋮−an1−a12−a22⋮−an2⋯⋯⋯−a1n−a2n⋮−annλE=λ0⋮00λ⋮0⋯⋯⋯00⋮λ
-
f(λ)f(\lambda)f(λ)是A的特征多项式
-
f(λ)=0f(\lambda)=0f(λ)=0(即∣λE−A∣=0|\lambda{E}-A|=\bold{0}∣λE−A∣=0)是A的特征方程
-
-
求解特征方程f(λ)=0f(\lambda)=0f(λ)=0的全部根,他们就是n阶方阵A的特征值,将他们记为λi,i=1,2,⋯,n\lambda_i,i=1,2,\cdots,nλi,i=1,2,⋯,n
-
对于每个λi\lambda_iλi,求解对应的齐次线性方程组(λiE−A)x=0(\lambda_i{E-A})x=\bold0(λiE−A)x=0
- 不妨将方阵Bi=λiE−AB_i=\lambda_{i}E-ABi=λiE−A,便于讨论
- 求齐次线性方程Bix=0B_ix=0Bix=0一组基础解系:Φ=α1,α2,⋯,αsi\Phi=\alpha_1,\alpha_2,\cdots,\alpha_{s_i}Φ=α1,α2,⋯,αsi,si=n−ris_i=n-r_isi=n−ri
- 则方阵A关于λi\lambda_iλi的全部特征向量表示为∑j=1sikjαj\sum\limits_{j=1}^{s_i}k_j\alpha_jj=1∑sikjαj
-
方阵特征值和特征向量的性质
-
代数学基本定理:任何一个非零的一元n次复系数多项式,都正好有n个复数根(重根视为多个根)
-
∑i=1nλi=∑i=1naii,\sum\limits_{i=1}^{n}\lambda_i=\sum\limits_{i=1}^{n}a_{ii}, i=1∑nλi=i=1∑naii,
- 其中∑i=1naii称为矩阵的迹其中\sum_{i=1}^{n}a_{ii}称为矩阵的迹其中∑i=1naii称为矩阵的迹
-
∏i=1nλi=∣A∣\prod_{i=1}^{n}\lambda_{i}=|A| i=1∏nλi=∣A∣
证明
-
对于n次多项式f(λ)f(\lambda)f(λ),他有n个复根,可以因式分解写成如下形式
- f(λ)=(λ−λ1)(λ−λ2)⋯(λ−λn)f(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)f(λ)=(λ−λ1)(λ−λ2)⋯(λ−λn)
-
对于
-
f(λ)=∣λE−A∣=∣λ−a11−a12⋯−a1n−a21λ−a22⋯−a2n⋮⋮⋮−an1−an2⋯λ−ann∣不妨把这个行列式记为B,B=f(λ)f(\lambda)=|\lambda{E}-A|= \begin{vmatrix} \lambda-a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& \lambda-a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&\lambda-a_{nn} \\ \end{vmatrix} \\不妨把这个行列式记为B,B=f(\lambda) f(λ)=∣λE−A∣=λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋯−a1n−a2n⋮λ−ann不妨把这个行列式记为B,B=f(λ)
-
f(λ)f(\lambda)f(λ)行列式展开后有n!项(未合化简同类项前),把它们记为θk,k=1,2,⋯,n!\theta_k,k=1,2,\cdots,n!θk,k=1,2,⋯,n!
- 是一个n次多项式
- 因为其中有1项是由主对角线元素相乘的积),把它记为
- ξ=θp=(λ−a11)(λ−a22)⋯(λ−ann)\xi=\theta_p=(\lambda-a_{11})(\lambda-a_{22})\cdots(\lambda-a_{nn})ξ=θp=(λ−a11)(λ−a22)⋯(λ−ann)
- 其余项之多含有对角线元素的n-2个元素(因为每个项的因子都取自不同行不同列)
- 如果θk\theta_kθk中有一个元素eije_{ij}eij不在主对角线上(i≠ji\neq{j}i=j)那么以为着θk\theta_{k}θk中不可能含有bii和bjjb_{ii}和b_{jj}bii和bjj
- 因为其中有1项是由主对角线元素相乘的积),把它记为
- 是一个n次多项式
-
现在,我们只对ξ\xiξ这一项感兴趣
- θp=λn−(a11+a22+⋯+ann)λn−1+⋯\theta_p=\lambda^{n}-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdotsθp=λn−(a11+a22+⋯+ann)λn−1+⋯
- f(λ)=θp+∑i,i≠pn!θif(\lambda)=\theta_p+\sum\limits_{i,i\neq{p}}^{n!}\theta_if(λ)=θp+i,i=p∑n!θi
- (注意,展开式中n,n−1n,n-1n,n−1次项的系数是只由θp\theta_pθp提供,其余θi,i≠p\theta_i,i\neq{p}θi,i=p只能够提供不超过n−2n-2n−2次项;
- 常数项可以通过取λ=0\lambda=0λ=0得到,即f(0)=∣0E−A∣=∣−A∣=(−1)n∣A∣f(0)=|0E-A|=|-A|=(-1)^n|A|f(0)=∣0E−A∣=∣−A∣=(−1)n∣A∣
- f(λ)=λn−(a11+a22+⋯+ann)λn−1+⋯∣−A∣λ0f(\lambda)=\lambda^{n}-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots|-A|\lambda^{0}f(λ)=λn−(a11+a22+⋯+ann)λn−1+⋯∣−A∣λ0
- 为什么是这样的,可以参考:math@多项式@求和式乘法@代数学基本定理_xuchaoxin1375的博客-CSDN博客
-
另一方面,设λ1,⋯,λn\lambda_1,\cdots,\lambda_nλ1,⋯,λn是f(λ)f(\lambda)f(λ)的n个特征值(根)
-
f(λ)=∏i(λ−λi)=λn−(∑i=1nλi)λn−1+⋯+∏i=1n(−λi)f(\lambda)=\prod_{i}(\lambda-\lambda_i) =\lambda^n-(\sum_{i=1}^{n}\lambda_i)\lambda^{n-1}+\cdots+\prod_{i=1}^{n}(-\lambda_i) f(λ)=i∏(λ−λi)=λn−(i=1∑nλi)λn−1+⋯+i=1∏n(−λi)
-
对比n−1n-1n−1次项的系数∑i=1naii=∑i=1nλi\sum_{i=1}^{n}a_{ii}=\sum_{i=1}^{n}\lambda_{i}∑i=1naii=∑i=1nλi
-
对比000此项系数∣−A∣=∏i=1n(−λi)|-A|=\prod_{i=1}^{n}(-\lambda_i)∣−A∣=∏i=1n(−λi),即(−1)n∣A∣=(−1)n∏in(λi)(-1)^n|A|=(-1)^n\prod_{i}^{n}(\lambda_i)(−1)n∣A∣=(−1)n∏in(λi),∣A∣=∏inλi|A|=\prod_{i}^{n}\lambda_i∣A∣=∏inλi
-
-
-
推论
- 方阵A可逆的条件是A的特征值不全为0
衍生特征值
- 设α\alphaα是矩阵A属于特征值λ0\lambda_0λ0的特征向量(记为α,A→λ\alpha,{A}\to{\lambda}α,A→λ,或者更直接的Aα=λ0αA\alpha=\lambda_0\alphaAα=λ0α)
- 设α,γ,A,λ0\alpha,\gamma,A,\lambda_0α,γ,A,λ0满足Aα=λ0α;Aγ=λ0γA\alpha=\lambda_{0}\alpha;A\gamma=\lambda_0\gammaAα=λ0α;Aγ=λ0γ,则:
- β=kα\beta=k\alphaβ=kα满足Aβ=λ0βA\beta=\lambda_0\betaAβ=λ0β
- 因为A(kα)=kAα=kλ0α=λ0(kα)A(k\alpha)=kA\alpha=k\lambda_0{\alpha}=\lambda_{0}(k\alpha)A(kα)=kAα=kλ0α=λ0(kα)
- ϕ=α+γ\phi=\alpha+\gammaϕ=α+γ满足Aϕ=λ0ϕA\phi=\lambda_0\phiAϕ=λ0ϕ
- A(α+γ)=Aα+Aγ=λ0α+λ0γ=λ0(α+γ)A(\alpha+\gamma)=A\alpha+A\gamma=\lambda_0\alpha+\lambda_0\gamma=\lambda_0(\alpha+\gamma)A(α+γ)=Aα+Aγ=λ0α+λ0γ=λ0(α+γ)
- 综合上述结论,可以得出:若αi,i=1,2,⋯,n\alpha_i,i=1,2,\cdots,nαi,i=1,2,⋯,n,λ,A,λ0\lambda,A,\lambda_0λ,A,λ0满足Aαi=αiλ0A\alpha_i=\alpha_i\lambda_0Aαi=αiλ0,则αi\alpha_iαi的任意线性组合θ=∑ikiαi\theta=\sum_i{k_i\alpha_i}θ=∑ikiαi满足Aθ=θλ0A\theta=\theta\lambda_0Aθ=θλ0
- β=kα\beta=k\alphaβ=kα满足Aβ=λ0βA\beta=\lambda_0\betaAβ=λ0β
更一般的
-
设α,A,λ\alpha,A,\lambdaα,A,λ满足Aα=λαA\alpha=\lambda{\alpha}Aα=λα,则:
-
对Aα=λαA\alpha=\lambda{\alpha}Aα=λα同乘以kkk,
- (kA)α=(kλ)α(kA)\alpha=(k\lambda)\alpha(kA)α=(kλ)α,
- A(kα)=λ(kα)A(k\alpha)=\lambda({k\alpha})A(kα)=λ(kα)
-
再次乘以kkk
- (kA)(kα)=(kλ)(kα)(kA)(k\alpha)=(k\lambda){(k\alpha)}(kA)(kα)=(kλ)(kα)
-
对Aα=λαA\alpha=\lambda\alphaAα=λα两边同时左乘AAA
- AAα=Aλα=λAα=λλαAA\alpha=A\lambda\alpha=\lambda{A\alpha}=\lambda{\lambda{\alpha}}AAα=Aλα=λAα=λλα
- A2α=λ2αA^2\alpha=\lambda^2\alphaA2α=λ2α
- A3α=Aλ2α,λ2Aα=λ3αA^3\alpha=A\lambda^2\alpha,\lambda^2A\alpha=\lambda^3\alphaA3α=Aλ2α,λ2Aα=λ3α
- 重复m-1次得到:Amα=λmαA^m\alpha=\lambda^m\alphaAmα=λmα
-
当AAA可逆时
- λ−1α=A−1α\lambda^{-1}\alpha=A^{-1}\alphaλ−1α=A−1α
- 对Aα=λαA\alpha=\lambda{\alpha}Aα=λα同时左乘A−1A^{-1}A−1
- α=λA−1α\alpha=\lambda A^{-1}\alphaα=λA−1α,两边同乘以λ−1\lambda^{-1}λ−1,λ−1α=A−1α\lambda^{-1}\alpha=A^{-1}\alphaλ−1α=A−1α
- (A∗)α=∣A∣λα(A^*)\alpha=\frac{|A|}{\lambda}\alpha(A∗)α=λ∣A∣α
- A−1=1∣A∣A∗A^{-1}=\frac{1}{|A|}A^*A−1=∣A∣1A∗
- λ−1α=(1∣A∣A∗)α\lambda^{-1}\alpha=(\frac{1}{|A|}A^*)\alphaλ−1α=(∣A∣1A∗)α
- ∣A∣λα=(A∗)α\frac{|A|}{\lambda}\alpha=(A^*)\alphaλ∣A∣α=(A∗)α
- (A∗)α=∣A∣λα(A^*)\alpha=\frac{|A|}{\lambda}\alpha(A∗)α=λ∣A∣α
- λ−1α=A−1α\lambda^{-1}\alpha=A^{-1}\alphaλ−1α=A−1α
-
-
推论:
- 特征向量不是被特征值所唯一确定的
- 特征值被特征向量唯一确定(一个特征向量只能属于一个特征值)
- 假设对于给定的α0\alpha_0α0,λ1,λ2,A\lambda_1,\lambda_2,Aλ1,λ2,A间满足:Aα0=λiα0,i=1,2A\alpha_0=\lambda_i\alpha_0,i=1,2Aα0=λiα0,i=1,2
- 因此λ1α0=λ2α0=Aα0\lambda_1\alpha_0=\lambda_2\alpha_0=A\alpha_0λ1α0=λ2α0=Aα0
- (λ1−λ2)α0=0(\lambda_1-\lambda_2)\alpha_0=0(λ1−λ2)α0=0
- 又因为α0≠0\alpha_0\neq{0}α0=0,所以λ1−λ2=0\lambda_1-\lambda_2=0λ1−λ2=0
- 所以λ1=λ2\lambda_1=\lambda_2λ1=λ2
- 所以给定α0\alpha_0α0,A的特征值是唯一确定的
- 假设对于给定的α0\alpha_0α0,λ1,λ2,A\lambda_1,\lambda_2,Aλ1,λ2,A间满足:Aα0=λiα0,i=1,2A\alpha_0=\lambda_i\alpha_0,i=1,2Aα0=λiα0,i=1,2
转置和特征值
-
方阵A的转置ATA^TAT的特征值和A的特征值相同
-
A:f(λ)=∣λE−A∣A:f(\lambda)=|\lambda{E}-A|A:f(λ)=∣λE−A∣
-
AT:f(λ)=∣λE−AT∣=∣(λE)T−AT∣=∣(λE−A)T∣=∣λE−A∣A^T:f(\lambda)=|\lambda{E}-A^T|=|(\lambda{E})^T-A^T|=|(\lambda{E}-A)^T|=|\lambda{E}-A|AT:f(λ)=∣λE−AT∣=∣(λE)T−AT∣=∣(λE−A)T∣=∣λE−A∣
-
可见,A,ATA,A^TA,AT具有相同的特征方程,因此特征值一定像相同
-
但是它们的特征向量不一定相同
- 因为前面我们讨论过,特征值不能够唯一确定特征向量
-
其他结论(方阵多项式的特征值与方阵本身特征值的关系)
-
设p(x)=∑i=0maixi=∑i=0mam−ixm−ip(x)=\sum\limits_{i=0}^{m}a_{i}x^i=\sum\limits_{i=0}^{m}a_{m-i}x^{m-i}p(x)=i=0∑maixi=i=0∑mam−ixm−i
- λ,A,α\lambda,A,\alphaλ,A,α满足Aα=λαA\alpha=\lambda\alphaAα=λα
- 则p(A)α=p(λ)αp(A)\alpha=p(\lambda)\alphap(A)α=p(λ)α
-
证明:
- p(A)α=∑i=0maiAiα=∑i=0maiλiα而p(λ)=∑i=0maiλi从而p(λ)α=∑i=0maiλiα因此p(A)α=p(λ)αp(A)\alpha=\sum\limits_{i=0}^{m}a_{i}A^i\alpha =\sum\limits_{i=0}^{m}a_{i}\lambda^i\alpha \\ 而p(\lambda)=\sum\limits_{i=0}^{m}a_{i}\lambda^i \\从而p(\lambda)\alpha=\sum\limits_{i=0}^{m}a_{i}\lambda^i\alpha \\ 因此p(A)\alpha=p(\lambda)\alpha p(A)α=i=0∑maiAiα=i=0∑maiλiα而p(λ)=i=0∑maiλi从而p(λ)α=i=0∑maiλiα因此p(A)α=p(λ)α
特征向量线性相关性
-
设n阶方阵A的特征向量为λi,i=1,2,⋯,n\lambda_i,i=1,2,\cdots,nλi,i=1,2,⋯,n,(λi≠λj\lambda_i\neq{\lambda_{j}}\,λi=λjif i≠ji\neq{j}i=j)
- 对应的特征向量为αi,i=1,2,⋯,n\alpha_i,i=1,2,\cdots,nαi,i=1,2,⋯,n
- 即:Aαi=λiαi,i=1,2,⋯,nA\alpha_i=\lambda_i\alpha_i,i=1,2,\cdots,nAαi=λiαi,i=1,2,⋯,n
- 那么ϕ=α1,⋯,αn\phi=\alpha_1,\cdots,\alpha_nϕ=α1,⋯,αn线性无关
- 通过数学归纳法证明
- 更一般的,设ψi=αi1,αi2,⋯,αisi\Large\psi_i=\alpha_{i1},\alpha_{i2},\cdots,\alpha_{is_i}ψi=αi1,αi2,⋯,αisi,αi∈{ψi}\alpha_i\in\{\psi_i\}αi∈{ψi}
- ψi\psi_iψi是同一个特征值λi\lambda_iλi的所有特征向量
- Ψ=ψ1,ψ2,⋯,ψn\Psi=\psi_1,\psi_2,\cdots,\psi_nΨ=ψ1,ψ2,⋯,ψn依然线性无关
- 对于ψi\psi_iψi:
- 若λi\lambda_iλi是一个k重特征值
- 那么对应于λi\lambda_iλi线性无关特征向量的个数u⩽ku\leqslant{k}u⩽k