当前位置: 首页 > news >正文

2.2 反向传播:神经网络如何“学习“?

一、神经网络就像小学生

想象一个刚学算术的小学生,老师每天布置练习题,学生根据例题尝试解题,老师批改后指出错误。神经网络的学习过程与此相似:

  • 输入层:相当于练习题(如数字图片)
  • 输出层:学生的答案(如识别数字是"3")
  • 损失函数:老师的批改(计算错误程度)
  • 反向传播:学生根据错误调整计算步骤的过程

二、前向传播:先做一遍练习题

假设我们要识别数字"3",神经网络的处理过程如下:

示例:

1输入层数据:[0.5, 0.8]  # 像素值
2权重参数:w1=0.3, w2=0.6, 偏置b=0.1
3
4# 隐藏层计算
5h = (0.5*0.3) + (0.8*0.6) + 0.1 = 0.73  
6激活值 = 1/(1+e^(-0.73)) ≈ 0.675  # Sigmoid函数
7
8# 输出层计算
9最终输出 = 0.675*0.4 + 0.2 = 0.47  # 假设目标值是0.8
10误差 = (0.8-0.47)^2 / 2 = 0.0545
11

此时网络认为图片有47%概率是"3",但正确答案应该是80%1

三、反向传播:老师批改作业

反向传播就像老师用红笔标注错误步骤:

1. 计算总误差(老师打分)

使用均方误差公式:
总误差 = Σ(预测值 - 真实值)^2 / 2

2. 逆向追溯责任(找错误根源)

通过链式法则逐层计算各参数的责任比例:

预览

以输出层权重w5为例:

1误差对w5的梯度 = (预测值-真实值) * 激活输出 * 激活导数  
2              = (0.47-0.8) * 0.675 * 0.675*(1-0.675) ≈ -0.033
3

3. 调整参数(学生改正错误)

按梯度方向调整参数:

1新w5 = 原w5 - 学习率*梯度  
2     = 0.4 - 0.1*(-0.033) = 0.4033
3

参数调整幅度就像调音量:误差越大,调整幅度越大

四、生活中的反向传播

假设你调整咖啡配方:

  1. 第一次:3g糖→太苦(误差大)
  2. 反向分析:糖量影响最大
  3. 第二次:5g糖→稍好(误差减小)
  4. 继续调整奶量、咖啡粉...

经过多次调整,最终找到最佳配方——这就是神经网络的学习过程!

五、优化学习效率的三个技巧

  1. 学习率:就像调整步伐大小
    • 太大容易错过最佳点(0.1是常用初始值)
  1. 动量:像下坡时的惯性
    • 避免在局部最优处卡住
  1. 批量训练:像同时批改多份作业
    • 更稳定地找到调整方向

六、核心公式总结

步骤

关键公式

类比

前向传播

a = σ(w*x + b)

做练习题

损失计算

L = ½Σ(y_true - y_pred)^2

计算错题数

反向传播

∂L/∂w = ∂L/∂a * ∂a/∂z * ∂z/∂w

分析错误原因

参数更新

w_new = w_old - η*∂L/∂w

调整学习方法

参考资料

  1. 反向传播手推公式示例
  2. 链式法则图解
  3. 动量优化原理
  4. 神经网络参数更新可视化
  5. 5分钟-通俗易懂 - 神经网络 反向传播算法(手算)_哔哩哔哩_bilibili
http://www.lryc.cn/news/537919.html

相关文章:

  • frp-tool,客户端frp命令行工具
  • 【学术投稿-第五届应用数学、建模与智能计算国际学术会议】CSS伪类选择器深度解析:分类、应用与技巧
  • 常用查找算法整理(顺序查找、二分查找、哈希查找、二叉排序树查找、平衡二叉树查找、红黑树查找、B树和B+树查找、分块查找)
  • Express 中 res 响应方法详解
  • DeepAR:一种用于时间序列预测的深度学习模型
  • 权限模型深度解析:RBAC vs ABAC vs PBAC vs TBAC,如何选择最适合的方案?
  • Windows逆向工程入门之堆栈结构与信息获取
  • 【c++初阶】类和对象②默认成员函数以及运算符重载初识
  • 【做一个微信小程序】校园地图页面实现
  • 成熟开发者需具备的能力
  • 计算机毕业设计--基于深度学习技术(Yolov11、v8、v7、v5)算法的高效人脸检测模型设计与实现(含Github代码+Web端在线体验界面)
  • 力扣做题记录 (二叉树)
  • 机试刷题_字符串的排列【python】
  • 百度智能云—千帆 ModelBuilder API的简单调用(Java)
  • unity学习43:子状态机 sub-state machine
  • Qt MainWindow
  • GDB QUICK REFERENCE (GDB 快速参考手册)
  • 【数据结构】 栈和队列
  • AI视频创作教程:如何用AI让古画动起来。
  • 撕碎QT面具(1):Tab Widget转到某个Tab页
  • DeepSeek24小时写作机器人,持续创作高质量文案
  • npm安装依赖(npm install)时遇到认证错误的解决方案
  • SpringBoot+微信小程序+数据可视化的宠物到家喂宠服务(程序+论文+讲解+安装+调试+售后等)
  • 免费大模型网站
  • OpenCV的主要模块
  • 使用 Python 爬虫和 FFmpeg 爬取 B 站高清视频
  • Retrieval-Augmented Generation for LargeLanguage Models: A Survey
  • 2025年2月16日(numpy-deepseek)
  • C#windows窗体人脸识别
  • 【第11章:生成式AI与创意应用—11.1 文本生成与创意写作辅助的实现与优化】