当前位置: 首页 > article >正文

【学习笔记】深度学习-梯度概念

一、定义

梯度向量不仅表示函数变化的速度,还表示函数增长最快的方向
在这里插入图片描述

二、【问】为什么说它表示方向?

在这里插入图片描述

三、【问】那在深度学习梯度下降的时候,还要判断梯度是正是负来更新参数吗?

假设某个参数是 w,损失函数对它的导数是 dw

情况一: dw > 0

说明当前点在一个上升区间,想让损失下降,w应该变小,也就是减去这个正的梯度。

情况二: dw < 0

说明当前点在一个下降区间,函数在往下走,w应该变大,同样地:减去负的梯度,相当于加上它的绝对
值。

结论

所以,无论正负,统一使用:w = w - α*dw就可以了!
减去正数 → 向左走(变小)
减去负数 → 向右走(变大)

优化

当样本数量很大的时候,需要对每个样本求偏导,再取平均值得到损失函数,(计算+存储)计算量会非常大
优化:随机梯度下降
从样本中随机取m个值,来进行梯度下降优化参数

http://www.lryc.cn/news/2394902.html

相关文章:

  • 【数据结构】图的存储(邻接矩阵与邻接表)
  • tomcat yum安装
  • 【Elasticsearch】suggest_mode
  • 数据库只更新特定字段的两种方式(先读后写 vs. 动态组织 SQL)-golang SQLx 实现代码(动态组织 SQL)
  • 从翻译后修饰角度解析人工合成途径与底盘细胞的适配性-文献精读136
  • Cesium快速入门到精通系列教程一
  • [Windows] 剪映 视频编辑处理
  • 决策树 GBDT XGBoost LightGBM
  • stm32 / arduino TPL0401A使用教程
  • 数据结构与算法之单链表面试题(新浪、百度、腾讯)
  • 单板机8088C语言计划
  • 一周学会Pandas2之Python数据处理与分析-数据重塑与透视-pivot() - 透视 (长 -> 宽,有限制)
  • 机器学习中无监督学习方法的聚类:划分式聚类、层次聚类、密度聚类
  • 【HW系列】—溯源与定位—Linux入侵排查
  • CPO-BP+MOPSO,冠豪猪优化BP神经网络+多目标粒子群算法!(Matlab源码)
  • 模块化设计,static和extern(面试题常见)
  • 【快速解决】数据库快速导出成sql文件
  • 使用 Syncfusion 在 .NET 8 中生成 PDF/DOC/XLS/PPT
  • LearnOpenGL-笔记-其十二
  • 【C++】C++面向对象设计的核心思想之一: 接口抽象、解耦和可扩展性
  • Namespace 命名空间的使用
  • mac 下安装Rust Toolchain(Nightly)
  • PHP中文网文章内容提取免费API接口教程
  • 【Java笔记】Spring IoC DI
  • 学习STC51单片机22(芯片为STC89C52RCRC)
  • ubuntu20.04.5--arm64版上使用node集成java
  • Linux --UDP套接字实现简单的网络聊天室
  • 嵌入式学习笔记 - keil安装目录下的头文件自动包含问题
  • word批量导出visio图
  • 把数据库做得能扩展:Aurora DSQL 的故事