当前位置: 首页 > news >正文

矩阵定理复习记录

矩阵复习

矩阵导数定理

若A是一个如下矩阵:
A = [ a 11 a 12 a 21 a 22 ] A= \begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix} A=[a11a21a12a22]
y是一个向量矩阵:
y ⃗ = [ y 1 y 2 ] \vec{y}=\begin{bmatrix}y_1\\y_2\end{bmatrix} y =[y1y2]
则可得 text 定理:
δ A ∗ y ⃗ δ y ⃗ = A T \frac{δA*\vec{y}}{δ\vec{y}} = A^T δy δAy =AT
δ y ⃗ T ∗ A δ y ⃗ = δ A T ∗ y ⃗ δ y ⃗ = A \frac{δ\vec{y}^T*A}{δ\vec{y}} = \frac{δA^T*\vec{y}}{δ\vec{y}} = A δy δy TA=δy δATy =A
也就是对A*y的矩阵,求偏导y,结果为A的转置矩阵;

还可得另一个定理:
δ y ⃗ T ∗ A y ⃗ δ y ⃗ = A y ⃗ + A T y ⃗ \frac{δ\vec{y}^T*A\vec{y}}{δ\vec{y}} = A\vec{y}+ A^T\vec{y} δy δy TAy =Ay +ATy
若A是一个对称矩阵,也就是 A T = A A^T=A AT=A,则上面的还会等于
2 A y ⃗ 2A\vec{y} 2Ay

δ符号表示求导, y ⃗ 表示一个向量 \vec{y}表示一个向量 y 表示一个向量

这部分的推导过程可参考此篇视频

矩阵平方定理

若矩阵A满足相乘原则,则有定理:
A 2 = A T ∗ A A^2 = A^T*A A2=ATA

单位矩阵

是一种恒等矩阵,对角线上全为1,其余全为0,如下:
I = [ 1 0 0 0 1 0 0 0 1 ] I = \begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix} I= 100010001
任何矩阵与单位矩阵相乘等于本身:
A ∗ I = I ∗ A = A A*I = I * A = A AI=IA=A

逆矩阵

注意逆矩阵不是转置矩阵,若两个矩阵A和B,n*n的方阵,且满足:
A ∗ B = I A*B=I AB=I
也就是矩阵相乘等于单位矩阵,也说明A就是B的逆矩阵,A是可逆的,记:B=A^-1

最小二乘法

若输入量为 x 1 , x 2 . . . x n x_1,x_2...x_n x1,x2...xn,输出量为 y 1 , y 2 . . . y n y_1,y_2...y_n y1,y2...yn,为了你和一条函数曲线,是的输入为 x i x_i xi,输出为 y i y_i yi,我们假定它是一个多项式函数如 y i = a x i 2 + b x i + c y_i = ax_i^2 + bx_i + c yi=axi2+bxi+c,x和y都有观察数据,求 a , b , c a,b,c a,b,c,因为数据又多组,带入矩阵中运算:
[ x 1 2 x 1 1 x 2 2 x 2 1 . . . . . . . . . x n 2 x n 2 1 ] [ a b c ] = [ y 1 y 2 . . . y n ] \begin{bmatrix}x_1^2 & x_1&1\\x_2^2&x_2&1\\...&...&...\\x_n^2&x_n^2&1\end{bmatrix}\begin{bmatrix}a\\b\\c\end{bmatrix}= \begin{bmatrix}y_1\\y_2\\...\\y_n\end{bmatrix} x12x22...xn2x1x2...xn211...1 abc = y1y2...yn
进而用X,A,Y替换:
X ∗ A = Y X*A=Y XA=Y
A矩阵就是我们要求取的未知参数,往往信号观察是在由噪声的环境中的,假设噪声为V,且噪声的均值为0,也就是正和负噪声,则推导公式:
X ∗ A = Y + V X*A=Y+V XA=Y+V
为了使误差最小,使用最小二乘法,二乘差值平方,也就是:
( Y − X ∗ A ) 2 = ( Y − X ∗ A ) T ( Y − X ∗ A ) (Y-X*A)^2 = (Y-X*A)^T(Y-X*A) (YXA)2=(YXA)T(YXA)
对上面的式子A求偏导:
δ ( Y − X ∗ A ) T ( Y − X ∗ A ) δ A \frac{δ(Y-X*A)^T(Y-X*A)}{δA} δAδ(YXA)T(YXA)
推导过程可参考此视频最小二乘法讲解,求出后领偏导函数等于0求极值,也就是误差最小值,得到定理:
A = ( X T X ) − 1 X T Y A = (X^TX)^{-1}X^TY A=(XTX)1XTY

http://www.lryc.cn/news/122763.html

相关文章:

  • Jenkins+Docker+SpringCloud微服务持续集成项目优化和微服务集群
  • 认识 spring 中的事务 与 事务的传播机制
  • PHP中的16个危险函数
  • 11、Nvidia显卡驱动、CUDA、cuDNN、Anaconda及Tensorflow Pytorch版本
  • 将数据库文件压缩并上传到文件服务器
  • docker — 容器网络
  • 腾讯面试题:使用Redis分布式锁可能会出现哪些问题?
  • 直接在html中引入Vue.js的cdn来实现Vue3的组合式API
  • YAPi在线接口文档简单案例(结合Vue前端Demo)
  • Java基础篇--Runtime类
  • 数字后端笔试题(1)DCG后congestion问题
  • 数据结构:交换排序
  • SpringBoot复习:(42)WebServerCustomizer的customize方法是在哪里被调用的?
  • 年至年的选择仿elementui的样式
  • 分类过程中的一种遮挡现象
  • 下一代服务架构:单体架构-->分布式架构-->微服务(DDD)-->软件定义架构(SDF with GraphEngine)
  • excel 之 VBA
  • 【数学建模】--聚类模型
  • css3新增选择器总结
  • 0基础学C#笔记10:归并排序法
  • nlohmann json:通过for遍历object和array
  • 适配器模式:将不兼容的接口转换为可兼容的接口
  • 【量化课程】07_量化回测
  • 竞赛项目 深度学习花卉识别 - python 机器视觉 opencv
  • 用对角线去遍历矩阵
  • 【vue】点击按钮弹出卡片,点击卡片中的取消按钮取消弹出的卡片(附代码)
  • 【K8S】pod 基础概念讲解
  • ASP.NET Core中间件记录管道图和内置中间件
  • [系统安全] 五十二.DataCon竞赛 (1)2020年Coremail钓鱼邮件识别及分类详解
  • Android学习之路(3) 布局