当前位置：首页 > news >正文

深度学习2（逻辑回归+损失函数+梯度下降）

news 2025/7/4 7:37:11

逻辑回归

逻辑回归损失函数

梯度下降算法

逻辑回归

在深度学习中，逻辑回归（Logistic Regression）是一种经典的二分类算法，同时也是神经网络的基础组件之一。

其作用是将输入特征的线性组合(x)通过一个非线性函数（Sigmoid）映射到 [0,1] 区间，表示属于某一类的概率。

回归函数公式

$\hat{y}=P(y=1|x)=\sigma (W^{T}+b)=\cfrac{1}{1 + e^{-(W^{T}+b) } }$

x 是输入特征向量

w 是权重

b 是偏置

sigmoid函数图像

逻辑回归损失函数

损失函数(lossfunction)用于衡量预测结果与真实值之间的误差。

逻辑回归的损失函数是交叉熵损失（Cross-Entropy Loss），它是衡量模型预测概率分布与真实标签分布之间差异的关键工具。

逻辑回归的损失函数公式

$L(\hat{y},y )=-y\log_{}{\hat{y}}-(1-y)\log_{}{(1-\hat{y})}$

注:在机器学习和深度学习的损失函数中，对数函数（log）默认以自然对数（底数为 e） 为底，即数学中的 ln⁡。

如果真实值y=1，则 $L(\hat{y},y )=-\log_{}{\hat{y}}$ ，此时想要损失越小，预测值需要约趋近于1

如果真实值y=0， $L(\hat{y},y )=-\log_{}{(1-\hat{y})}$ ，此时想要损失越小，预测值需要约趋近于0

以上是单个样本的损失值计算，而总体平均损失值（又称代价函数）公式为：

$J(w,b)=\frac{1}{n} \sum_{i=1}^{n} L(\hat{y}_{i},y_{i})$

梯度下降算法

目的：找到使损失函数最小的值

函数的梯度(gradient)指出了函数的最陡增长方向。梯度的方向走，函数增长得就越快。那么按梯度的负方向走，函数值自然就降低得最快了。

模型的训练目标即是寻找合适的w与b以最小化代价函数值。假设w与b都是一维实数，那么可以得到如下的J关于w与b的图:

可以看到，成本函数J是一个凸函数，其含有局部最低。可以通过迭代调整参数，沿着损失函数的负梯度方向逐步更新，使损失函数值减小。

参数w和b的更新公式

$w=w -\alpha \frac{\mathrm{d} J(w,b)}{\mathrm{d} w}$

$b=b -\alpha \frac{\mathrm{d} J(w,b)}{\mathrm{d} b}$

注:其中a表示学习速率，即每次更新的w的步伐长度。当w大于最优解 w'时，导数大于 0，那么 w
就会向更小的方向更新。反之当 w 小于最优解 w' 时，导数小于 0，那么 w 就会向更大的方向更新。迭代直到收敛。

查看全文

http://www.lryc.cn/news/579396.html

在 VSCode 中高效配置自定义注释模板 (无需插件)

Python 中如何使用 Conda 管理版本和创建 Django 项目

【LUT技术专题】3DLUT压缩-CLUT

朝鲜APT组织使用Nim语言恶意软件对macOS发起隐秘Web3与加密货币攻击

.net wpf混淆

uniapp 使用ffmpeg播放rtsp

QT常用类和模块

Qt宝藏库：20+实用开源项目合集

Java——初始guava（1）

【python】OOP：Object-Oriented Programming

Linux基本命令篇 —— tar命令

Redis缓存架构实战

微算法科技（NASDAQ MLGO）基于量子图像处理的边缘检测算法：开拓图像分析新视野

中国户外品牌全球竞争力榜单发布：科技突围与文化赋能重塑行业格局

扫地机产品--电池是否存在类似充电宝自燃问题？

【JS笔记】JS 和 noodjs 的常见操作（十）

依赖属性附加属性

从混沌到澄明，AI如何重构我们的决策地图与未来图景

CSS `@scope` 实战指南：开启局部样式隔离新时代

NVIDIA Spectrum-3 SN4000 系列SN4000 SN4000 系列速度高达 400Gb/秒的现代横向扩展分布式数据中心应用提供支持。

React 学习（3）

http、SSL、TLS、https、证书

KMP(Kotlin Multiplatform)改造(Android/iOS)老项目

java8 Collectors.mapping 使用例子学习

学习开发之数组和集合的相似与不同

逻辑回归

逻辑回归损失函数

梯度下降算法

相关文章：