当前位置: 首页 > news >正文

LA@特征值和特征向量

文章目录

    • 特征值和特征向量
    • 求解方阵的特征值和特征向量🎈
      • 特征多项式@特征方程
    • 方阵特征值和特征向量的性质
      • 证明
      • 推论
      • 衍生特征值
      • 更一般的
      • 转置和特征值
      • 其他结论(方阵多项式的特征值与方阵本身特征值的关系)
      • 特征向量线性相关性

特征值和特征向量

  • 许多定量分析模型中,常常需要寻求数λ\lambdaλ非零向量α\alphaα,使得Aα=λαA\alpha=\lambda\alphaAα=λα

  • 一般特征值和特征向量是成对存在的,在概念上,是不可分割且相互依赖地同时定义出来

  • 设A是n阶方阵

    • 如果存在数λ\lambdaλ和n维非零列向量α(α≠0)\alpha(\alpha\neq{0})α(α=0),满足

      • Aα=λα或(λα−Aα=0;(λE−A)α=0)A\alpha=\lambda\alpha \\或(\lambda\alpha-A\alpha=0;(\lambda{E}-A)\alpha=0) Aα=λα(λαAα=0;(λEA)α=0)

      • λ\lambdaλ是方阵A的一个特征值

      • α\alphaα为方阵A的对应于λ\lambdaλ的一个特征向量

  • 特征值问题是对方阵而言的,如果说矩阵的特征值或特征向量,那么这个矩阵默认是方阵

(3122)(11)=(44)=4(11)\begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} \begin{pmatrix} 1\\ 1 \end{pmatrix} =\begin{pmatrix} 4 \\ 4 \end{pmatrix} =4\begin{pmatrix} 1 \\ 1 \end{pmatrix} (3212)(11)=(44)=4(11)

  • 上述等式链告诉我们,矩阵

    • A=(3122)作用在向量α=(11)上的效果和常数4作用在α上的效果在乘法上是一样的A=\begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} 作用在向量\alpha=\begin{pmatrix} 1\\ 1 \end{pmatrix} \\上的效果和常数4作用在\alpha上的效果在乘法上是一样的 A=(3212)作用在向量α=(11)上的效果和常数4作用在α上的效果在乘法上是一样的

      • 也就是说,矩阵左乘特征向量的结果和特征向量左乘特征向量的结果一样

  • A2=AA^2=AA2=A,证明A的特征值为0或1

    • Aα=λαA2α=A(Aα)=Aλα=λ(Aα)=λ(λα)=λ2α又A2=A;A2α=Aα=λαA\alpha=\lambda{\alpha} \\A^2\alpha=A(A\alpha)=A\lambda\alpha=\lambda{(A\alpha)}=\lambda(\lambda\alpha)=\lambda^2\alpha \\又A^2=A;A^2\alpha=A\alpha=\lambda\alpha Aα=λαA2α=A(Aα)=Aλα=λ(Aα)=λ(λα)=λ2αA2=A;A2α=Aα=λα

    • ∴λ2α=λα(λ2−λ)α=0,α≠0λ2−λ=λ(λ−1)=0λ=0或1\\\therefore \lambda^2\alpha=\lambda\alpha \\(\lambda^2-\lambda)\alpha=\bold{0},\alpha\neq\bold0 \\\lambda^2-\lambda=\lambda(\lambda-1)=0 \\\lambda=0或1 λ2α=λα(λ2λ)α=0,α=0λ2λ=λ(λ1)=0λ=01

  • 方法2:

    • 同时对Aα=λα左乘A:A2α=λ(Aα)Aα=λ2αλα=λ2α同时对A\alpha=\lambda\alpha左乘A: \\A^2\alpha=\lambda(A\alpha) \\A\alpha=\lambda^{2}\alpha \\\lambda\alpha=\lambda^2{\alpha} 同时对Aα=λα左乘A:A2α=λ(Aα)Aα=λ2αλα=λ2α

    • 其余和方法1一致

求解方阵的特征值和特征向量🎈

  • 对于方程组S
    (λE−A)α=0;α≠0(\lambda{E}-A)\alpha=\bold0;\alpha\neq{\bold0} (λEA)α=0;α=0

    • 由于α≠0由于\alpha\neq{\bold0}由于α=0,所以α\alphaα是齐次线性方程组(λE−A)x=0(\lambda{E}-A)x=\bold0(λEA)x=0非零解
    • 而上述齐次线性方程组有非零解,仅当其系数行列式为0
    • 即矩阵A的特征值λ\lambdaλ是方程∣λE−A∣=0|\lambda{E}-A|=0λEA=0的根
    • 如果A是一个n阶方阵,则A在复数范围内恰有n个特征值(包括重根)
      • 即使矩阵A的元素全为实数,其特征值也可能是复数

特征多项式@特征方程

  • 设n阶方阵A=(aij)A=(a_{ij})A=(aij)

    • f(λ)=∣λE−A∣=∣λ−a11−a12⋯−a1n−a21λ−a22⋯−a2n⋮⋮⋮−an1−an2⋯λ−ann∣f(\lambda)=|\lambda{E}-A|= \begin{vmatrix} \lambda-a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& \lambda-a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&\lambda-a_{nn} \\ \end{vmatrix} f(λ)=λEA=λa11a21an1a12λa22an2a1na2nλann

      • −A=(−a11−a12⋯−a1n−a21−a22⋯−a2n⋮⋮⋮−an1−an2⋯−ann)λE=(λ0⋯00λ⋯0⋮⋮⋮00⋯λ)-A=\begin{pmatrix} -a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& -a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&-a_{nn} \\ \end{pmatrix} \\ \lambda{E}= \begin{pmatrix} \lambda& 0& \cdots&0 \\ 0& \lambda& \cdots&0 \\ \vdots& \vdots& &\vdots \\ 0& 0& \cdots&\lambda \\ \end{pmatrix} A=a11a21an1a12a22an2a1na2nannλE=λ000λ000λ

      • f(λ)f(\lambda)f(λ)是A的特征多项式

      • f(λ)=0f(\lambda)=0f(λ)=0(即∣λE−A∣=0|\lambda{E}-A|=\bold{0}λEA=0)是A的特征方程

    • 求解特征方程f(λ)=0f(\lambda)=0f(λ)=0的全部根,他们就是n阶方阵A的特征值,将他们记为λi,i=1,2,⋯,n\lambda_i,i=1,2,\cdots,nλi,i=1,2,,n

    • 对于每个λi\lambda_iλi,求解对应的齐次线性方程组(λiE−A)x=0(\lambda_i{E-A})x=\bold0(λiEA)x=0

      • 不妨将方阵Bi=λiE−AB_i=\lambda_{i}E-ABi=λiEA,便于讨论
      • 求齐次线性方程Bix=0B_ix=0Bix=0一组基础解系:Φ=α1,α2,⋯,αsi\Phi=\alpha_1,\alpha_2,\cdots,\alpha_{s_i}Φ=α1,α2,,αsi,si=n−ris_i=n-r_isi=nri
      • 则方阵A关于λi\lambda_iλi的全部特征向量表示为∑j=1sikjαj\sum\limits_{j=1}^{s_i}k_j\alpha_jj=1sikjαj

方阵特征值和特征向量的性质

  • 代数学基本定理:任何一个非零的一元n次复系数多项式,都正好有n个复数根(重根视为多个根)

  • ∑i=1nλi=∑i=1naii,\sum\limits_{i=1}^{n}\lambda_i=\sum\limits_{i=1}^{n}a_{ii}, i=1nλi=i=1naii,

    • 其中∑i=1naii称为矩阵的迹其中\sum_{i=1}^{n}a_{ii}称为矩阵的迹其中i=1naii称为矩阵的迹
  • ∏i=1nλi=∣A∣\prod_{i=1}^{n}\lambda_{i}=|A| i=1nλi=A

证明

  • 对于n次多项式f(λ)f(\lambda)f(λ),他有n个复根,可以因式分解写成如下形式

    • f(λ)=(λ−λ1)(λ−λ2)⋯(λ−λn)f(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)f(λ)=(λλ1)(λλ2)(λλn)
  • 对于

    • f(λ)=∣λE−A∣=∣λ−a11−a12⋯−a1n−a21λ−a22⋯−a2n⋮⋮⋮−an1−an2⋯λ−ann∣不妨把这个行列式记为B,B=f(λ)f(\lambda)=|\lambda{E}-A|= \begin{vmatrix} \lambda-a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& \lambda-a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&\lambda-a_{nn} \\ \end{vmatrix} \\不妨把这个行列式记为B,B=f(\lambda) f(λ)=λEA=λa11a21an1a12λa22an2a1na2nλann不妨把这个行列式记为B,B=f(λ)

      • f(λ)f(\lambda)f(λ)行列式展开后有n!项(未合化简同类项前),把它们记为θk,k=1,2,⋯,n!\theta_k,k=1,2,\cdots,n!θk,k=1,2,,n!

        • 是一个n次多项式
          • 因为其中有1项是由主对角线元素相乘的积),把它记为
            • ξ=θp=(λ−a11)(λ−a22)⋯(λ−ann)\xi=\theta_p=(\lambda-a_{11})(\lambda-a_{22})\cdots(\lambda-a_{nn})ξ=θp=(λa11)(λa22)(λann)
          • 其余项之多含有对角线元素的n-2个元素(因为每个项的因子都取自不同行不同列)
            • 如果θk\theta_kθk中有一个元素eije_{ij}eij不在主对角线上(i≠ji\neq{j}i=j)那么以为着θk\theta_{k}θk中不可能含有bii和bjjb_{ii}和b_{jj}biibjj
      • 现在,我们只对ξ\xiξ这一项感兴趣

        • θp=λn−(a11+a22+⋯+ann)λn−1+⋯\theta_p=\lambda^{n}-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdotsθp=λn(a11+a22++ann)λn1+
        • f(λ)=θp+∑i,i≠pn!θif(\lambda)=\theta_p+\sum\limits_{i,i\neq{p}}^{n!}\theta_if(λ)=θp+i,i=pn!θi
          • (注意,展开式中n,n−1n,n-1n,n1次项的系数是只由θp\theta_pθp提供,其余θi,i≠p\theta_i,i\neq{p}θi,i=p只能够提供不超过n−2n-2n2次项;
          • 常数项可以通过取λ=0\lambda=0λ=0得到,即f(0)=∣0E−A∣=∣−A∣=(−1)n∣A∣f(0)=|0E-A|=|-A|=(-1)^n|A|f(0)=∣0EA=A=(1)nA
          • f(λ)=λn−(a11+a22+⋯+ann)λn−1+⋯∣−A∣λ0f(\lambda)=\lambda^{n}-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots|-A|\lambda^{0}f(λ)=λn(a11+a22++ann)λn1+Aλ0
        • 为什么是这样的,可以参考:math@多项式@求和式乘法@代数学基本定理_xuchaoxin1375的博客-CSDN博客
      • 另一方面,设λ1,⋯,λn\lambda_1,\cdots,\lambda_nλ1,,λnf(λ)f(\lambda)f(λ)的n个特征值(根)

        • f(λ)=∏i(λ−λi)=λn−(∑i=1nλi)λn−1+⋯+∏i=1n(−λi)f(\lambda)=\prod_{i}(\lambda-\lambda_i) =\lambda^n-(\sum_{i=1}^{n}\lambda_i)\lambda^{n-1}+\cdots+\prod_{i=1}^{n}(-\lambda_i) f(λ)=i(λλi)=λn(i=1nλi)λn1++i=1n(λi)

        • 对比n−1n-1n1次项的系数∑i=1naii=∑i=1nλi\sum_{i=1}^{n}a_{ii}=\sum_{i=1}^{n}\lambda_{i}i=1naii=i=1nλi

        • 对比000此项系数∣−A∣=∏i=1n(−λi)|-A|=\prod_{i=1}^{n}(-\lambda_i)A=i=1n(λi),即(−1)n∣A∣=(−1)n∏in(λi)(-1)^n|A|=(-1)^n\prod_{i}^{n}(\lambda_i)(1)nA=(1)nin(λi),∣A∣=∏inλi|A|=\prod_{i}^{n}\lambda_iA=inλi

推论

  • 方阵A可逆的条件是A的特征值不全为0

衍生特征值

  • α\alphaα是矩阵A属于特征值λ0\lambda_0λ0的特征向量(记为α,A→λ\alpha,{A}\to{\lambda}α,Aλ,或者更直接的Aα=λ0αA\alpha=\lambda_0\alphaAα=λ0α)
  • α,γ,A,λ0\alpha,\gamma,A,\lambda_0α,γ,A,λ0满足Aα=λ0α;Aγ=λ0γA\alpha=\lambda_{0}\alpha;A\gamma=\lambda_0\gammaAα=λ0α;Aγ=λ0γ,则:
    • β=kα\beta=k\alphaβ=kα满足Aβ=λ0βA\beta=\lambda_0\betaAβ=λ0β
      • 因为A(kα)=kAα=kλ0α=λ0(kα)A(k\alpha)=kA\alpha=k\lambda_0{\alpha}=\lambda_{0}(k\alpha)A(kα)=kAα=kλ0α=λ0(kα)
    • ϕ=α+γ\phi=\alpha+\gammaϕ=α+γ满足Aϕ=λ0ϕA\phi=\lambda_0\phiAϕ=λ0ϕ
      • A(α+γ)=Aα+Aγ=λ0α+λ0γ=λ0(α+γ)A(\alpha+\gamma)=A\alpha+A\gamma=\lambda_0\alpha+\lambda_0\gamma=\lambda_0(\alpha+\gamma)A(α+γ)=Aα+Aγ=λ0α+λ0γ=λ0(α+γ)
    • 综合上述结论,可以得出:若αi,i=1,2,⋯,n\alpha_i,i=1,2,\cdots,nαi,i=1,2,,n,λ,A,λ0\lambda,A,\lambda_0λ,A,λ0满足Aαi=αiλ0A\alpha_i=\alpha_i\lambda_0Aαi=αiλ0,则αi\alpha_iαi的任意线性组合θ=∑ikiαi\theta=\sum_i{k_i\alpha_i}θ=ikiαi满足Aθ=θλ0A\theta=\theta\lambda_0Aθ=θλ0

更一般的

  • α,A,λ\alpha,A,\lambdaα,A,λ满足Aα=λαA\alpha=\lambda{\alpha}Aα=λα,则:

    • Aα=λαA\alpha=\lambda{\alpha}Aα=λα同乘以kkk,

      • (kA)α=(kλ)α(kA)\alpha=(k\lambda)\alpha(kA)α=()α,
      • A(kα)=λ(kα)A(k\alpha)=\lambda({k\alpha})A(kα)=λ(kα)
    • 再次乘以kkk

      • (kA)(kα)=(kλ)(kα)(kA)(k\alpha)=(k\lambda){(k\alpha)}(kA)(kα)=()(kα)
    • Aα=λαA\alpha=\lambda\alphaAα=λα两边同时左乘AAA

      • AAα=Aλα=λAα=λλαAA\alpha=A\lambda\alpha=\lambda{A\alpha}=\lambda{\lambda{\alpha}}AAα=Aλα=λAα=λλα
      • A2α=λ2αA^2\alpha=\lambda^2\alphaA2α=λ2α
      • A3α=Aλ2α,λ2Aα=λ3αA^3\alpha=A\lambda^2\alpha,\lambda^2A\alpha=\lambda^3\alphaA3α=Aλ2α,λ2Aα=λ3α
      • 重复m-1次得到:Amα=λmαA^m\alpha=\lambda^m\alphaAmα=λmα
    • AAA可逆时

      1. λ−1α=A−1α\lambda^{-1}\alpha=A^{-1}\alphaλ1α=A1α
        • Aα=λαA\alpha=\lambda{\alpha}Aα=λα同时左乘A−1A^{-1}A1
        • α=λA−1α\alpha=\lambda A^{-1}\alphaα=λA1α,两边同乘以λ−1\lambda^{-1}λ1λ−1α=A−1α\lambda^{-1}\alpha=A^{-1}\alphaλ1α=A1α
      2. (A∗)α=∣A∣λα(A^*)\alpha=\frac{|A|}{\lambda}\alpha(A)α=λAα
        • A−1=1∣A∣A∗A^{-1}=\frac{1}{|A|}A^*A1=A1A
        • λ−1α=(1∣A∣A∗)α\lambda^{-1}\alpha=(\frac{1}{|A|}A^*)\alphaλ1α=(A1A)α
        • ∣A∣λα=(A∗)α\frac{|A|}{\lambda}\alpha=(A^*)\alphaλAα=(A)α
        • (A∗)α=∣A∣λα(A^*)\alpha=\frac{|A|}{\lambda}\alpha(A)α=λAα
  • 推论:

    • 特征向量不是被特征值所唯一确定的
    • 特征值被特征向量唯一确定(一个特征向量只能属于一个特征值)
      • 假设对于给定的α0\alpha_0α0,λ1,λ2,A\lambda_1,\lambda_2,Aλ1,λ2,A间满足:Aα0=λiα0,i=1,2A\alpha_0=\lambda_i\alpha_0,i=1,2Aα0=λiα0,i=1,2
        • 因此λ1α0=λ2α0=Aα0\lambda_1\alpha_0=\lambda_2\alpha_0=A\alpha_0λ1α0=λ2α0=Aα0
        • (λ1−λ2)α0=0(\lambda_1-\lambda_2)\alpha_0=0(λ1λ2)α0=0
          • 又因为α0≠0\alpha_0\neq{0}α0=0,所以λ1−λ2=0\lambda_1-\lambda_2=0λ1λ2=0
          • 所以λ1=λ2\lambda_1=\lambda_2λ1=λ2
        • 所以给定α0\alpha_0α0,A的特征值是唯一确定的

转置和特征值

  • 方阵A的转置ATA^TAT的特征值和A的特征值相同

    • A:f(λ)=∣λE−A∣A:f(\lambda)=|\lambda{E}-A|A:f(λ)=λEA

    • AT:f(λ)=∣λE−AT∣=∣(λE)T−AT∣=∣(λE−A)T∣=∣λE−A∣A^T:f(\lambda)=|\lambda{E}-A^T|=|(\lambda{E})^T-A^T|=|(\lambda{E}-A)^T|=|\lambda{E}-A|AT:f(λ)=λEAT=(λE)TAT=(λEA)T=λEA

    • 可见,A,ATA,A^TA,AT具有相同的特征方程,因此特征值一定像相同

    • 但是它们的特征向量不一定相同

      • 因为前面我们讨论过,特征值不能够唯一确定特征向量

其他结论(方阵多项式的特征值与方阵本身特征值的关系)

  • p(x)=∑i=0maixi=∑i=0mam−ixm−ip(x)=\sum\limits_{i=0}^{m}a_{i}x^i=\sum\limits_{i=0}^{m}a_{m-i}x^{m-i}p(x)=i=0maixi=i=0mamixmi

    • λ,A,α\lambda,A,\alphaλ,A,α满足Aα=λαA\alpha=\lambda\alphaAα=λα
    • p(A)α=p(λ)αp(A)\alpha=p(\lambda)\alphap(A)α=p(λ)α
  • 证明:

    • p(A)α=∑i=0maiAiα=∑i=0maiλiα而p(λ)=∑i=0maiλi从而p(λ)α=∑i=0maiλiα因此p(A)α=p(λ)αp(A)\alpha=\sum\limits_{i=0}^{m}a_{i}A^i\alpha =\sum\limits_{i=0}^{m}a_{i}\lambda^i\alpha \\ 而p(\lambda)=\sum\limits_{i=0}^{m}a_{i}\lambda^i \\从而p(\lambda)\alpha=\sum\limits_{i=0}^{m}a_{i}\lambda^i\alpha \\ 因此p(A)\alpha=p(\lambda)\alpha p(A)α=i=0maiAiα=i=0maiλiαp(λ)=i=0maiλi从而p(λ)α=i=0maiλiα因此p(A)α=p(λ)α

特征向量线性相关性

  • 设n阶方阵A的特征向量为λi,i=1,2,⋯,n\lambda_i,i=1,2,\cdots,nλi,i=1,2,,n,(λi≠λj\lambda_i\neq{\lambda_{j}}\,λi=λjif i≠ji\neq{j}i=j)

    • 对应的特征向量为αi,i=1,2,⋯,n\alpha_i,i=1,2,\cdots,nαi,i=1,2,,n
    • 即:Aαi=λiαi,i=1,2,⋯,nA\alpha_i=\lambda_i\alpha_i,i=1,2,\cdots,nAαi=λiαi,i=1,2,,n
    • 那么ϕ=α1,⋯,αn\phi=\alpha_1,\cdots,\alpha_nϕ=α1,,αn线性无关
      • 通过数学归纳法证明
    • 更一般的,设ψi=αi1,αi2,⋯,αisi\Large\psi_i=\alpha_{i1},\alpha_{i2},\cdots,\alpha_{is_i}ψi=αi1,αi2,,αisi,αi∈{ψi}\alpha_i\in\{\psi_i\}αi{ψi}
      • ψi\psi_iψi是同一个特征值λi\lambda_iλi的所有特征向量
    • Ψ=ψ1,ψ2,⋯,ψn\Psi=\psi_1,\psi_2,\cdots,\psi_nΨ=ψ1,ψ2,,ψn依然线性无关
    • 对于ψi\psi_iψi:
      • λi\lambda_iλi是一个k重特征值
      • 那么对应于λi\lambda_iλi线性无关特征向量的个数u⩽ku\leqslant{k}uk
http://www.lryc.cn/news/8556.html

相关文章:

  • transpose代码学习
  • 【Redis】Redis 常用数据类型操作 ② ( 数据库操作 | 切换数据库 | 查询当前数据库键个数 | 清空当前数据库 | 清空所有数据库 )
  • 最简单的物体识别例子
  • 指针——“C”
  • 学习 Linux 内核书籍推荐
  • 深圳硬件黑客松活动,开放报名!
  • 力扣sql简单篇练习(十七)
  • Linux网络技术学习(六)—— 网络设备初始化(II)
  • 一手教你如何搭建Hadoop基于Zookeeper的集群(5台主机)
  • Spring Cloud是什么?怎么理解Spring Cloud?
  • robotframework + selenium自动化测试常见的问题
  • 2023春招java面试题及答案
  • QT+OpenGL光照
  • OpenCV-PyQT项目实战(7)项目案例03:鼠标框选
  • vue2版本《后台管理模式》(上)
  • C++与C基础重叠部分
  • 神经网络基础部件-卷积层详解
  • 【计算机网络】HTTPS协议原理
  • 21岁,华科博士在读,我的赛事Top经验
  • 基于ThinkPHP6.0+Vue+uni-app的多商户商城系统好用吗?
  • Linux中断
  • Excel+SQL实战项目 - 餐饮业日销售情况分析仪
  • 电商导购CPS,京东联盟如何跟单实现用户和订单绑定
  • Redis学习【6】之BitMap、HyperLogLog、Geospatial操作命令 (1)
  • JAVA实现心跳检测【长连接】
  • python3.9安装和pandas安装踩坑处理
  • 2023.2.15每日一题——867. 转置矩阵
  • 【人脸识别】Partial-FC:让你在一台机器上训练1000万个id人脸数据集成为可能!
  • 递归方法读取任意深度的 JSON 对象的键值
  • 黑马redis学习记录:分布式锁