当前位置: 首页 > news >正文

【机器学习300问】68、随机初始化神经网络权重的好处?

一、固定的初始化神经网络权重可能带来的问题

在训练神经网络的时候,初始化权重如果全部设置为0或某个过大值/过小值。会导致一些问题:

  • 对称权重问题:全为0的初始化权重会导致神经网络在前向传播时接收到的信号输入相同。每个神经网络节点中的公式都是一样的,这种对称性会导致所有节点的输出完全一致,故而无法实现特征的多样性和区分度。这样一来一群节点和一个节点没什么区别。
  • 梯度消失/爆炸:初始化权重过大或过小,可能会导致训练初期的梯度更新剧烈,引发梯度爆炸;反之,若权重过小,梯度则可能在反向传播过程中逐渐减小至接近于0,造成梯度消失。这两种情况都会严重影响网络的学习能力。

二、随机初始化神经网络权重的好处

(1)打破对称性

        初始化神经网络的权重很像是给一个舞台剧的导演在剧开始前分配角色。如果所有角色一开始都是一样的,那么剧情将无法展开,因为每个演员都会做出完全相同的表演。相似地,如果我们给所有的神经网络权重相同的起始值,神经元将无法学习到不同的特征,因为在每次迭代中,每个神经元都会以相同的方式更新。这种现象称为对称权重问题。

        随机初始化权重就像是为每个角色随机分配一种性格和背景。这虽然可能会有一定的混乱,但也为剧情发展提供了多样性和丰富性,每个演员能够为剧情提供独特的贡献。同样,在神经网络中,随机初始化权重能够打破权重的对称性,确保每个神经元可以学习到不同的特征。

        随机初始化打破了这种对称性,每个神经元将以不同的初始权重开始训练,使得每个神经元从一开始就有独特的“视角”来处理输入数据,从而促进网络学习到更丰富的特征表示。

(2)避免梯度消失/爆炸

就如同为一辆赛车精心调整引擎转速,既不过热也不熄火,以确保其能在赛道上稳健加速。

        随机初始化有助于分散权重的大小,使其既不太大也不太小,有利于保持梯度在合理的范围内波动,确保训练过程的稳定性。一般在使用Sigmoid激活函数和Tanh激活函数的神经网络中,通常设置成0.01。

(3)促进模型收敛

        就像在广阔的森林中随机放置多个起点,让多个猎人同时出发寻找最优路线,比所有人都从同一个地方出发更容易快速找到通往猎物的最佳路径。

        随机初始化为神经网络提供了广泛的搜索空间,使得模型在训练初期就能探索多种潜在的解决方案。随着训练的进行,模型通过反向传播和优化算法逐步调整这些初始权重,最终收敛到一个有效拟合训练数据的局部极小点。

http://www.lryc.cn/news/338821.html

相关文章:

  • 数据结构与算法——20.B-树
  • Tomcat源码解析——Tomcat的启动流程
  • 蓝桥杯真题演练:2023B组c/c++
  • 微信小程序实现预约生成二维码
  • 专业140+总分410+北京理工大学826信号处理导论考研经验北理工电子信息通信工程,真题,参考书,大纲。
  • 做一个后台项目的架构
  • 嵌入式单片机 TTL电平、232电平、485电平的区别和联系
  • 2024年大唐杯备考
  • Spring Boot(06):Spring Boot与MySQL搭配,打造极简高效的数据管理系统
  • Vue3 + Vite 构建组件库发布到 npm
  • Vite多环境配置与打包:灵活高效的Vue开发工作流
  • 从零实现诗词GPT大模型:数据集介绍和预处理
  • 45.HarmonyOS鸿蒙系统 App(ArkUI)创建列表(List)
  • 推荐算法之协同过滤
  • Kotlin 面试题
  • TCM(Tightly Coupled Memory)紧密耦合存储器简介
  • 《自动机理论、语言和计算导论》阅读笔记:p172-p224
  • typescript playwright 笔记
  • 从零实现诗词GPT大模型:了解Transformer架构
  • 温故知新之-TCP Keepalive机制及长短连接
  • 架构师系列-搜索引擎ElasticSearch(七)- 集群管理之分片
  • 基于Spring Boot实现的图书个性化推荐系统
  • 安全加速SCDN带的态势感知能为网站安全带来哪些帮助
  • java面向对象.day21(继承02--super)
  • 【数据结构】4.List的介绍
  • acwing算法提高之图论--最近公共祖先
  • C语言 函数——断言与防御式编程
  • 【opencv】示例-travelsalesman.cpp 使用模拟退火算法求解旅行商问题
  • 【linux深入剖析】深入理解软硬链接 | 动静态库的制作以及使用
  • xss常用标签和触发事件