当前位置: 首页 > news >正文

深度学习2(逻辑回归+损失函数+梯度下降)

目录

逻辑回归

逻辑回归损失函数

梯度下降算法


逻辑回归

        在深度学习中,逻辑回归(Logistic Regression)是一种经典的二分类算法,同时也是神经网络的基础组件之一。

        其作用是将输入特征的线性组合(x)通过一个非线性函数(Sigmoid)映射到 [0,1] 区间,表示属于某一类的概率。

回归函数公式

\hat{y}=P(y=1|x)=\sigma (W^{T}+b)=\cfrac{1}{1 + e^{-(W^{T}+b) } }

x 是输入特征向量

w 是权重

b 是偏置

sigmoid函数图像


逻辑回归损失函数

        损失函数(lossfunction)用于衡量预测结果与真实值之间的误差。

        逻辑回归的损失函数交叉熵损失(Cross-Entropy Loss),它是衡量模型预测概率分布与真实标签分布之间差异的关键工具。

逻辑回归的损失函数公式

L(\hat{y},y )=-y\log_{}{\hat{y}}-(1-y)\log_{}{(1-\hat{y})}

        注:在机器学习和深度学习的损失函数中,对数函数(log)默认以自然对数(底数为 e) 为底,即数学中的 ln⁡。

        如果真实值y=1,则L(\hat{y},y )=-\log_{}{\hat{y}},此时想要损失越小,预测值需要约趋近于1

        如果真实值y=0,L(\hat{y},y )=-\log_{}{(1-\hat{y})},此时想要损失越小,预测值需要约趋近于0

        以上是单个样本的损失值计算,而总体平均损失值(又称代价函数)公式为:

J(w,b)=\frac{1}{n} \sum_{i=1}^{n} L(\hat{y}_{i},y_{i})


梯度下降算法

        目的:找到使损失函数最小的值

        函数的梯度(gradient)指出了函数的最陡增长方向。梯度的方向走,函数增长得就越快。那么按梯度的负方向走,函数值自然就降低得最快了。

        模型的训练目标即是寻找合适的w与b以最小化代价函数值。假设w与b都是一维实数,那么可以得到如下的J关于w与b的图:

        可以看到,成本函数J是一个凸函数,其含有局部最低。可以通过迭代调整参数沿着损失函数的负梯度方向逐步更新,使损失函数值减小。


参数w和b的更新公式

w=w -\alpha \frac{\mathrm{d} J(w,b)}{\mathrm{d} w}

b=b -\alpha \frac{\mathrm{d} J(w,b)}{\mathrm{d} b}

注:其中a表示学习速率,即每次更新的w的步伐长度。当w大于最优解 w'时,导数大于 0,那么 w
就会向更小的方向更新。反之当 w 小于最优解 w' 时,导数小于 0,那么 w 就会向更大的方向更新。迭代直到收敛。

http://www.lryc.cn/news/579396.html

相关文章:

  • 在 VSCode 中高效配置自定义注释模板 (无需插件)
  • Python 中如何使用 Conda 管理版本和创建 Django 项目
  • Flowable多引擎架构搭建方案
  • 车载以太网-IP 掩码 vlan 端口
  • 前端的一些报错
  • Odoo 中国特色高级工作流审批模块研发
  • 编程基础:成员函数
  • 【LUT技术专题】3DLUT压缩-CLUT
  • 朝鲜APT组织使用Nim语言恶意软件对macOS发起隐秘Web3与加密货币攻击
  • .net wpf混淆
  • uniapp 使用ffmpeg播放rtsp
  • QT常用类和模块
  • Qt宝藏库:20+实用开源项目合集
  • Java——初始guava(1)
  • 【python】OOP:Object-Oriented Programming
  • Linux基本命令篇 —— tar命令
  • Redis缓存架构实战
  • 微算法科技(NASDAQ MLGO)基于量子图像处理的边缘检测算法:开拓图像分析新视野
  • 中国户外品牌全球竞争力榜单发布:科技突围与文化赋能重塑行业格局
  • 扫地机产品--电池是否存在类似充电宝自燃问题?
  • 【JS笔记】JS 和 noodjs 的常见操作(十)
  • 依赖属性附加属性
  • 从混沌到澄明,AI如何重构我们的决策地图与未来图景
  • CSS `@scope` 实战指南:开启局部样式隔离新时代
  • NVIDIA Spectrum-3 SN4000 系列SN4000 SN4000 系列速度高达 400Gb/秒的现代横向扩展分布式数据中心应用提供支持。
  • React 学习(3)
  • http、SSL、TLS、https、证书
  • KMP(Kotlin Multiplatform)改造(Android/iOS)老项目
  • java8 Collectors.mapping 使用 例子 学习
  • 学习开发之数组和集合的相似与不同