当前位置: 首页 > news >正文

反向传播与随机梯度下降

反向传播实际上就是在算各个阶段梯度,每层的传入实际是之前各层根据链式法则梯度相乘的结果。反向传播最初传入的Δout是1,Δ通常表示很少量的意思,Δout=1的时候这样在反向传播的时候算出来的dw和dx刚好就是当前梯度。深度神经网络中每层都会记录正向传播时该层传入的x,就是为了反向传播的时候计算dw的时候用到。反向传播的时候也会利用w计算出dx来作为下一层的反向传播的输入。反向传播时每层的输入都是前几层梯度相乘的结果(链式法则),每层的输出也应该是本层梯度乘以输入的结果(链式法则),需要注意的是计算MatMul节点的反向传播时要注意矩阵形状,所以需要矩阵转置。反向传播计算的各种梯度就是为了梯度下降做准备工作。

梯度下降的时候代码如下:

class SGD:

def __init__(self, lr=0.01):

self.lr = lr

def update(self, params, grads):

for i in range(len(params)):

params[i] -= self.lr * grads[i]

params 是每层神经网络的w和b,grads 对应的是各层参数的梯度。 params[i] -= self.lr * grads[i] 表示每层的w和b都要梯度下降,这是因为反向传播的时候,每层的梯度都是损失函数f_loss(x)对x的导数的一部分,根据链式法则,因为链式法则是相乘关系所以每个因子梯度下降总体梯度也是下降的。

代码来源《深度学习进阶-自然语言处理》第一章

http://www.lryc.cn/news/38362.html

相关文章:

  • 一个conda引起的CPU异常
  • java Date 和 Calendar类 万字详解(通俗易懂)
  • 扩展欧几里得算法及其应用
  • JAVA练习75-全排列
  • Linux下Docker安装mysql-超详细步骤
  • 弹性存储-对象存储OSS部分
  • 强推!30个遥感数据下载网站整理分享
  • 进程系统调用
  • dubbo进阶——服务导出
  • 【竞品分析】如何撰写竞品分析?竞品分析的基本结构?以及优秀的竞品分析案例
  • 海思ubootsd卡协议
  • nuxt3使用总结
  • 指向函数的指针详解,以及如何使用指向函数的指针变量做函数参数
  • Spring——spring整合JUnit
  • 保障信息安全:使用PyZbar库识别二维码图片可以快速获取二维码中的信息,保障信息安全。
  • 从LeNet到ResNet:深入探索卷积神经网络
  • 计算机组成原理_总线标准
  • 蓝桥杯C/C++VIP试题每日一练之芯片测试
  • 树莓派测试wifi与eth速率
  • 关系抽取方面的基础
  • 蓝桥杯嵌入式(G4系列):定时器捕获
  • 多态的定义、重写、原理
  • Angular 配置api代理 proxy 实践
  • ES: 数据增,删,改,批量操作
  • 伯努利方程示例 Python 计算(汽水流体和喷泉工程)
  • 2022年中职网络安全竞赛——应用服务漏洞扫描与利用解析(详细)
  • yyds,Elasticsearch Template自动化管理新索引创建
  • 蓝桥杯嵌入式ADC与DAC(都不需要中断)
  • 网络视频的防盗与破解
  • FPGA 20个例程篇:20.USB2.0/RS232/LAN控制并行DAC输出任意频率正弦波、梯形波、三角波、方波(二)