当前位置: 首页 > news >正文

本科生学深度学习一残差网络,解决梯度消失和爆炸

看到订阅的激励还在继续,今天写下残差网络

1、梯度爆炸和梯度消失

梯度爆炸和梯度消失是两种常见的问题,由神经网络的结构和参数初始化方式引起。它们都与深度神经网络中的反向传播过程相关。

梯度爆炸:这是指在反向传播期间,梯度逐渐增大并最终超出了有效范围。这通常发生在深度神经网络中,因为梯度在每一层的权重更新中相乘。如果初始梯度较大,多次相乘会导致梯度值呈指数增长,最终导致梯度爆炸。这会使权重值变得非常大,使网络不稳定,难以训练。

举个例子:5 *5 *5在多次乘积之后数据指数级增长,在训练的时候参数调整很难快速到位。

梯度消失:这是指在反向传播期间,梯度逐渐减小并最终变得非常小,接近零。这通常发生在深度神经网络中,因为梯度在每一层的权重更新中相乘。如果初始梯度较小,多次相乘会导致梯度值逐渐趋近于零。这导致底层的权重几乎不更新,这些层几乎没有学习到有用的信息,从而限制了网络的深度。

举个例子:0.1 *0.1 *0.1 在多次乘积之后就非常小,在计算机中小数的表示是不精确的,相当于无限趋近于0

2、残差网络

ResNet引入了残差连接,允许信息在不同层之间直接跳跃传递。

这样,网络可以学习将输入映射到残差(差异),而不是直接映射到目标输出。这种残差学习的方式使得在训练过程中更容易传递梯度,因为网络可以轻松地学习将输入信息添加到输出中,而不需要学习复杂的非线性变换。

在一般的卷积神经网络中,网络的输出是输入数据的映射,即y=F(x),也就是输入数据进行卷积和激活函数后的输出,如下图。

http://www.lryc.cn/news/334736.html

相关文章:

  • 初识SpringMVC
  • 【Leetcode】2009. 使数组连续的最少操作数
  • LeetCode-347. 前 K 个高频元素【数组 哈希表 分治 桶排序 计数 快速选择 排序 堆(优先队列)】
  • K8S Deployment HA
  • 【Linux】linux 在指定根目录下,查找wav文件并删除
  • 三、SpringBoot3 整合 SpringMVC
  • 设计模式之解释器模式(上)
  • [23年蓝桥杯] 买二赠一
  • PgSQL的with as语法
  • 六、c++代码中的安全风险-fopen
  • uniapp项目问题及解决(前后端互联)
  • 面试算法-154-搜索二维矩阵 II
  • Java中Stream流介绍
  • 深度学习的层、算子和函数空间
  • Pillow教程11:九宫格切图的实现方法(安排!!!)
  • Macos 部署自己的privateGpt(2024-0404)
  • 先安装CUDA后安装Visual Studio的额外配置
  • 2024 蓝桥打卡Day35
  • 【Java】单例模式
  • Linux|从 STDIN 读取 Awk 输入
  • 关于K8S集群中maste节点r和worker节点的20道面试题
  • 基于 OpenHarmony HistogramComponent 柱状图开发指南
  • C语言指针相关
  • 设计模式:责任链模式
  • 【Linux】 OpenSSH_9.3p1 升级到 OpenSSH_9.6p1(亲测无问题,建议收藏)
  • 宁波中墙建材对于蒸压加气混凝土砌块2024年前景预测
  • 【神经网络】卷积神经网络CNN
  • 微信小程序-接入sse数据流并实现打字机效果( ChatGPT )
  • 深入了解iOS内存(WWDC 2018)笔记-内存诊断
  • 《C语言深度解剖》(4):深入理解一维数组和二维数组