当前位置: 首页 > news >正文

《昇思 25 天学习打卡营第 6 天 | 函数式自动微分 》

《昇思 25 天学习打卡营第 6 天 | 函数式自动微分 》

活动地址:https://xihe.mindspore.cn/events/mindspore-training-camp
签名:Sam9029


函数式自动微分

自动微分是深度学习中的一个核心概念,它允许我们自动计算模型参数的梯度,从而进行参数更新。在本章节中

将通过MindSpore框架来探索自动微分的原理和应用。

在MindSpore中,自动微分主要通过函数式编程范式来实现。这意味着我们可以通过定义函数来表达数学运算,然后利用MindSpore提供的gradvalue_and_grad接口来获取梯度。

代码示例

首先,我们定义一个简单的单层线性变换模型:

import mindspore
from mindspore import nn, ops
from mindspore import Tensor, Parameterx = ops.ones(5, mindspore.float32)  # 输入张量
y = ops.zeros(3, mindspore.float32)  # 期望输出
w = Parameter(Tensor(np.random.randn(5, 3), mindspore.float32), name='w')  # 权重
b = Parameter(Tensor(np.random.randn(3), mindspore.float32), name='b')  # 偏置

接下来,我们定义计算损失的函数:

def function(x, y, w, b):z = ops.matmul(x, w) + b  # 正向传播loss = ops.binary_cross_entropy_with_logits(z, y)  # 计算损失return loss

使用grad函数计算梯度:

grad_fn = mindspore.grad(function, (2, 3))  # 对w和b求导
grads = grad_fn(x, y, w, b)  # 计算梯度
print(grads)  # 打印梯度

思考与讲解

在上述代码中,我们首先创建了输入数据x和期望输出y,以及模型参数wb。通过Parameter类包装参数,使其成为可训练的参数。

function函数中,我们实现了模型的正向传播过程,并计算了损失。通过grad函数,我们能够自动获取模型参数对损失的梯度,这是自动微分的魔力所在。

Stop Gradient

在某些情况下,我们可能不希望某个中间结果z对最终的梯度计算产生影响。这时,我们可以使用stop_gradient操作来截断梯度的传播:

def function_stop_gradient(x, y, w, b):z = ops.matmul(x, w) + bloss = ops.binary_cross_entropy_with_logits(z, y)return loss, ops.stop_gradient(z)

stop_gradient操作在深度学习中非常有用,尤其是在处理循环神经网络或者需要控制梯度流动的场景中。

神经网络梯度计算

在面向对象编程范式下,我们可以通过继承nn.Cell来构建神经网络模型。以下是一个简单的单层线性网络示例:

class Network(nn.Cell):def init(self):super().init()self.w = wself.b = bdef construct(self, x):z = ops.matmul(x, self.w) + self.breturn z

在构建模型和损失函数后,我们可以通过value_and_grad接口来实现反向传播:

model = Network()
loss_fn = nn.BCEWithLogitsLoss()
forward_fn = lambda x, y: loss_fn(model(x), y)
grad_fn = mindspore.value_and_grad(forward_fn, None, weights=model.trainable_params())
loss, grads = grad_fn(x, y)
print(grads)  # 打印梯度

通过面向对象的方式构建模型,我们可以更清晰地组织和管理模型的参数和行为。value_and_grad接口的使用,让我们能够方便地实现反向传播和梯度更新。

自动微分是深度学习框架中的一个强大工具,它简化了梯度计算的过程,使得我们能够专注于模型的设计和优化。通过MindSpore框架的学习和实践,我对自动微分有了更深入的理解。随着学习的深入,我相信我能够更好地应用这些知识来解决实际问题。

http://www.lryc.cn/news/383327.html

相关文章:

  • 刷题——二叉树的中序遍历
  • 圈复杂度.
  • 分类预测 | Matlab实现GA-XGBoost遗传算法优化XGBoost的多特征分类预测
  • 说说 golang 中的接口和反射
  • 小程序注册
  • 工作记录2
  • linux挂载硬盘(解决linux不显示硬盘问题)
  • 运输标签扫描仪可简化运输和接收任务
  • Stable Diffusion 3 大模型文生图实践
  • Linux grep技巧 删除含有指定关键词的行,创建新文件
  • ChatMoney还能写剧本杀?
  • 优化系统小工具
  • 调幅信号AM的原理与matlab实现
  • [MySql]两阶段提交
  • 掌握rpc、grpc并探究内在本质
  • 构造,析构,垃圾回收
  • 杂记 | 搭建反向代理防止OpenAI API被封禁(对于此次收到邮件提示7月9日后将被屏蔽的解决参考)
  • 利用ref实现防抖
  • SAP ABAP 之OOALV
  • 构建实用的Flutter文件列表:从简到繁的完美演进
  • spring使用@PostConstruct踩得坑
  • 【Mac】XnViewMP for Mac(图片浏览查看器)及同类型软件介绍
  • win10修改远程桌面端口,Windows 10下修改远程桌面端口及服务器关闭445端口的操作指南
  • 口感探险之旅:勇闯红酒世界,揭秘复杂风味的无尽奥秘
  • 吉时利 Keithley2440 数字源表
  • PPT的精细化优化与提升策略
  • awtk踩坑记录三:移植awtk-mvvm到Awtk Designer项目
  • 07 - matlab m_map地学绘图工具基础函数 - 绘制等高线
  • Kotlin设计模式:享元模式(Flyweight Pattern)
  • java压缩pdf