当前位置: 首页 > news >正文

机器学习5-线性回归之损失函数

线性回归中,我们通常使用最小二乘法(Ordinary Least Squares, OLS)来求解损失函数。线性回归的目标是找到一条直线,使得预测值与实际值的平方差最小化。
假设有数据集 \{(x^{(1)}, y^{(1)}), (x^{(2)}, y^{(2)}), \ldots, (x^{(m)}, y^{(m)})\}其中 x^{(i)} 是输入特征,y^{(i)}  是对应的输出。

线性回归的模型假设是:

h_\theta(x) = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \ldots + \theta_n x_n

其中, x_1, x_2, \ldots, x_n 是输入特征, \theta_0, \theta_1, \ldots, \theta_n 是模型的参数。

损失函数(成本函数)表示预测值与实际值之间的差异。对于线性回归,损失函数通常采用均方误差(Mean Squared Error, MSE):

J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2

其中 m 是数据集中的样本数量

求解损失函数的过程就是找到能够使损失函数最小化的模型参数 \theta 。我们通过最小化损失函数来找到最优的参数。这可以通过梯度下降等优化算法来实现。梯度下降的步骤如下:

1. 初始化参数:选择一组初始参数 \theta .

2. 计算梯度:计算损失函数对每个参数的偏导数。

3. 更新参数:使用梯度信息来更新参数,减小损失函数值。

4. 重复步骤2和步骤3:直到收敛或达到预定的迭代次数。

对于线性回归的梯度下降算法,参数的更新规则为:

\theta_j = \theta_j - \alpha \frac{\partial J(\theta)}{\partial \theta_j}

其中 \alpha 是学习率,控制每次参数更新的步长。

在具体的计算中,求解偏导数 \frac{\partial J(\theta)}{\partial \theta_j} 并代入梯度下降公式进行迭代,直到损失函数收敛到最小值。


下面是对损失函数的偏导数计算过程:

均方误差损失函数:

J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2

现在,我们将 J(\theta) 展开并对每个 \theta_j 求偏导数。

首先,计算单个样本的损失:

L(\theta) = \frac{1}{2} (h_\theta(x) - y)^2

然后,对 L(\theta) 对 \theta_j 求偏导数:

\frac{\partial L(\theta)}{\partial \theta_j} = (h_\theta(x) - y) \frac{\partial h_\theta(x)}{\partial \theta_j}

现在,我们对 h_\theta(x) 对 \theta_j 求偏导数:

\frac{\partial h_\theta(x)}{\partial \theta_j} = x_j

将其代入损失函数的偏导数中:

\frac{\partial J(\theta)}{\partial \theta_j} = \frac{1}{m} \sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)}) x_j^{(i)}


这就是对于线性回归的均方误差损失函数的偏导数计算过程。在实际应用中,梯度下降算法会根据这些偏导数的信息,迭代更新参数,直至损失函数收敛到最小值。

结论:

以上就是线性回归中求解损失函数的基本过程。这个过程是通过迭代优化算法来找到最优参数,使得模型的预测值与实际值之间的均方误差最小。

http://www.lryc.cn/news/293367.html

相关文章:

  • vulhub中Adminer ElasticSearch 和 ClickHouse 错误页面SSRF漏洞复现(CVE-2021-21311)
  • 浅谈Zookeeper及windows下详细安装步骤
  • vite, vue3, vue-router, vuex, ES6学习日记
  • 25考研|660/880/1000/1800全年带刷计划
  • Mybatis基础教程及使用细节
  • 10 分钟在K8s 中部署轻量级日志系统 Loki
  • 图像处理python基础
  • 基于WordPress开发微信小程序2:决定开发一个wordpress主题
  • [Python] 什么是网格搜索以及scikit-learn中GridSearch类的介绍和使用案例?
  • Linux-正则表达式
  • Java基础学习:System类和Static方法的实际使用
  • 线性代数------矩阵的运算和逆矩阵
  • Flutter 开发3:创建第一个Flutter应用
  • Linux中断下半部分:软中断,tasklet和工作队列
  • Flink CEP实现10秒内连续登录失败用户分析
  • QSqlRelationalTableModel 关系表格模型
  • JS和CSS实现的原生轮播图
  • 【微服务】skywalking自定义链路追踪与日志采集
  • MYSQL基础问题
  • SpringBoot使用Guava实现日志脱敏(含源码)
  • 数据结构—动态查找
  • Tarjan算法学习笔记
  • vue 项目涉及的焦点聚焦、格式化日期、判断是否为对象或数组、判断是否为空、深拷贝、节流、防抖
  • 软件工程知识梳理6-运行和维护
  • docker- php7.4
  • 开发一个Android App,在项目中完成添加联系人的功能,通过ContentResolver向系统中添加联系人信息。
  • Flume搭建
  • Web APIs 1 DOM操作
  • dvwa,xss反射型lowmedium
  • 从云计算到物联网:虚拟化技术的演变与嵌入式系统的融合