当前位置: 首页 > news >正文

机器学习-关于线性回归的表示方式和矩阵的基本运算规则

最近在学习机器学习的过程中,发现关于线性回归的表示和矩阵的运算容易费解,而且随着学习的深入容易搞混,因此特意做了一些研究,并且记录下来和大家分享。

一、线性模型有哪些表示方式?

器学习中,线性模型是指模型的输出是输入特征的线性组合。根的不同,线性模型有多种表示方式,主要包括:

1.线性回归(Linear Regression):

用于回归任务,模型形式为:

2.逻辑回归(istic Regression):

用于二分类任务,模型形式为:

3.线性判别分析(Linear criminant Analysis, LDA):

用于分类任务,特别是二分类问题。LDA 寻找一影方向,使得投影后同类样本尽可,异类样本尽可能远离。模型形式为:

4.支持向量机(Support Vector MachinSVM):

用于分类任务,线性可分情况下,模型形式为:

5.感知机(Perceptron)

用于二分类任务,模型形式为:

这些线性模型在不同的任务中应用广泛,选择合适的模型取决于具体的应用场景和数据特征。

二、那么线性模型的矩阵表示是什么样的呢?

机器学习中,线性模型通常可以使用矩阵形式表示,这种表示方式在处理多元线性回归等问题时尤为方便。以下是线性模型的矩阵表示:

1.线性模型的矩阵形式:

假设我们有( n ) 个样本,每个样本有 p 个特征。线性模型可以:

其中:

  • Y 是 n × 1 的向量,表示所有样本的目标值。

  • X是n × p的特征矩阵,每一行对应一个样本的特征向量。

  • w是p×1的权重向量。

  • b是n×1 的偏置向量,通常为常数向量 b⋅1,其中 b 是偏置项。

2. 增广矩阵表示:

为了简化表示,我们可以将偏置项b 合并到权重向量 w 中。具体方法是向特征矩阵 X 加一列全为 1 的列,得到增广特征矩阵 X',同时将偏置项作为权重向量的一个分量。这样,模型可以表示为:

Y=X′w′

其中:

这种增广矩阵的表示方式简化了模型的表示和计算。

3. 损失函数的矩阵表示

      在线性回归中,常用的损失函数是均方误差(M,其矩阵形式为:

通过矩阵形式表示线性模型,可以简化模型的表示和计算,特别是在处理多元线性回归和高维数据时,这种表示方式尤为有效

4.举例说明

为了更直观地理解线性模型的矩阵表示,我们通过一个具体的例子来说明。假设我们有一个包含 3 个样本的数据集,每个样本有 2 个特征。我们的目标是建立一个线性回归模型来预测目标值。

(1)数据表示:

(2)增广特征矩阵:

(3)权重向量:

(4)线性模型表示:

(5)求解权重向量:

三、需要了解的矩阵运算的几个定律:

1.在矩阵运算中,矩阵的加法和乘法遵循以下定律:

矩阵加法的定律:

矩阵乘法的定律:

    注意:

    • 矩阵乘法不满足交换律:一般情况下,矩阵乘法不满足交换律,即 AB≠BA。只有在特定情况下(例如 A和 B\ 都是对角矩阵且具有相同的维度)才可能满足交换律。

    2.在矩阵运算中,转置操作具有以下常见性质:

    四、线性回归,解释一下如何求导得到最优w

    1.之前的文章,我曾经提到过正规方程求得最优w的过程:

    2、其中求导遵循的规则如下:

    标量对向量的求导:

    向量内积的求导:

    二次型函数的求导:

    矩阵求导的链式法则:

    在应用这些公式时,需注意矩阵的维度匹配和转置操作。特别是在链式法则中,矩阵 A 的转置 A^T 出现在求导结果中,这是因为在矩阵乘法中,维度需要匹配,转置操作可以调整矩阵的维度以确保运算的合法性。

    http://www.lryc.cn/news/533827.html

    相关文章:

  1. kafka 3.5.0 raft协议安装
  2. 后台管理系统网页开发
  3. 使用一个大语言模型对另一个大语言模型进行“调教”
  4. golang使用sqlite3,开启wal模式,并发读写
  5. 如何利用maven更优雅的打包
  6. 音频进阶学习十二——Z变换一(Z变换、收敛域、性质与定理)
  7. cursor指令工具
  8. MySQL 主从读写分离实现方案(一)—MariaDB MaxScale实现mysql8读写分离
  9. 阿里云 | DeepSeek人工智能大模型安装部署
  10. LLAMA-Factory安装教程(解决报错cannot allocate memory in static TLS block的问题)
  11. STM32 CUBE Can调试
  12. MySQL数据存储- 索引组织表
  13. 基于STM32设计的仓库环境监测与预警系统
  14. VSCode便捷开发
  15. 理解 Maven 的 pom.xml 文件
  16. docker数据持久化的意义
  17. opentelemetry-collector 配置elasticsearch
  18. ASP.NET Core JWT Version
  19. 【ArcGIS】R语言空间分析、模拟预测与可视化技术
  20. 日常知识点之面试后反思遗留问题汇总
  21. 链表(LinkedList) 1
  22. Qt:Qt Creator项目创建
  23. windows11上,使用pipx安装Poetry,Poetry的安装路径是什么?
  24. 详解状态模式
  25. 能否通过蓝牙建立TCP/IP连接来传输数据
  26. uniapp mqttjs 小程序开发
  27. 爬虫工程师分享:获取京东商品详情SKU数据的技术难点与攻破方法
  28. 数据库操作与数据管理——Rust 与 SQLite 的集成
  29. LeetCode 0063.不同路径 II:动态规划 - 原地使用地图数组,几乎无额外空间开销
  30. elementui:el-table支持搜索、切换分页多选功能,以及数据回显