当前位置: 首页 > news >正文

每天五分钟深度学习:如何使用计算图来反向计算参数的导数?

本文重点

在上一个课程中,我们使用一个例子来计算函数J,也就相当于前向传播的过程,本节课程我们将学习如何使用计算图计算函数J的导数。相当于反向传播的过程。

计算J对v的导数,dJ/dv=3

计算J对a的导数,dJ/da=(dJ/dv)*(dv/da)=3*1=3

计算J对u的导数,dJ/du=(dJ/dv)*(dv/du)=3*1=3

计算J对b的导数,dJ/db=(dJ/dv)*(dv/du)*(du/db)=3*1*c=3c

因为本例中c=2,所以dJ/db=6

以上都是输出值J(最终变量J)对其它变量的导数,这里我们要引入一种新的符号,我们使用:

dv来表示dJ/dv

da来表示dJ/da

du来表示dJ/du

db来表示dJ/db

现在我们已经知道了输出J对其它变量的导数计算方法,核心就是从右往左按照计算图进行链式计算。

http://www.lryc.cn/news/356592.html

相关文章:

  • 常见排序算法之选择排序
  • Redis 事件机制 - AE 抽象层
  • Java | Leetcode Java题解之第118题杨辉三角
  • DNS 解析过程
  • Golang | Leetcode Golang题解之第118题杨辉三角
  • 操作系统实验——线程与进程
  • 最强端侧多模态模型MiniCPM-V 2.5,8B 参数,性能超越 GPT-4V 和 Gemini Pro
  • Spring Boot中如何查询PGSQL分表后的数据
  • 如何学习一个新技能
  • sklearn之logistic回归
  • Warning: Each child in a list should have a unique “key“ prop.
  • JavaSE:StringBuilder和StringBuffer类
  • C语言在线编程网站:探索编程的奥秘与深度
  • Android 之广播监听网络变化
  • Hono 框架使用经验谈
  • mac 下配置mysql的全局环境变量
  • 小红书云原生 Kafka 技术剖析:分层存储与弹性伸缩
  • Python实现解码二进制数据以匹配给定的C++结构体
  • 实施阶段(2024年5月)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第13章第3节 (弱引用是系统托管的 )
  • 安装WordPress
  • 【STL库源码剖析】list 简单实现
  • web前端框架设计第十一课-常用插件
  • Java基础-注解
  • SpringCloud之SSO单点登录-基于Gateway和OAuth2的跨系统统一认证和鉴权详解
  • 二分查找算法详讲(三种版本写法)原创
  • Git钩子(Hooks)之commit之前自动执行脚本
  • nano机器人2:机械臂的视觉抓取
  • 技术速递|宣布 Java on Azure 开发工具支持 Java on Azure Container Apps
  • 随机森林算法实现分类