当前位置: 首页 > news >正文

每天五分钟玩转深度学习框架PyTorch:梯度下降之学习率衰减

本文重点

我们前面学习了优化器optim,然后学习了为神经网络不同层设置不同的学习率,本节课程我们讲解学习率衰减的方法,也就是说如何在训练过程中动态的修改学习率,本文介绍两种方法。本文是学习第6步(优化器)

为什么要进行学习率衰减

对于一阶梯度进行优化的方法而言,开始的时候更新的幅度是比较大的,也就是说刚开始进行梯度下降的时候可以将学习率设置的大一些,但是训练集的loss下降到一定的程度之后,使用这个太大的学习率就会导致loss一直来回震荡,那么此时我们就可以进行学习率的衰减。

pytorch中的学习率调整的两种方法

方法一:直接修改optimizer中的param_groups中队形的学习率lr

方法二:构建新的优化器

方法三:利用lr_scheduler()提供的几种衰减函数

方法一

import torch
import matplotlib.pyplot as plt
from torch.optim import *
import torch.nn as nn
class net(nn.Module):def __init__(self):super(net,self).__init__()self.fc = nn.Linear(1,10)def forward(self,x):return self.fc(x)
model = net()
LR = 0.01
optimize
http://www.lryc.cn/news/440792.html

相关文章:

  • 智能家居配上高颜值UI,瞬间感觉消费不起了呢
  • Winform登录实现及工具栏切换
  • Git bash使用
  • Java入门程序-HelloWorld
  • 计算机人工智能前沿进展-大语言模型方向-2024-09-12
  • Android MediaPlayer + GLSurfaceView 播放视频
  • gitee远程仓库OPEN GIT BASH HERE从错误中学习
  • 如何查看当前系统中所有具有sudo权限的用户?
  • 在线制作PPT组织架构图!这个AI工具简单又好用!
  • Mysql 视图存储过程触发器
  • 【天池比赛】【零基础入门金融风控 Task2赛题理解】实战进行中……20240915更新至2.3.4.3 查看训练集测试集中特征属性只有一值的特征
  • 配置Windows内核开发环境
  • nanoGPT用红楼梦数据从头训练babyGPT-12.32M实现任意问答
  • PDF转图片的思路思考
  • lnmp - 登录技术方案设计与实现
  • 如何在 Qt 的 QListWidget 中逐行添加和显示数据
  • Java API 之集合框架进阶
  • Java String isEmpty()方法
  • Redisson分布式锁分析,可重入、可续锁(看门狗)
  • C++掉血迷宫
  • Spring Boot- 数据库相关问题
  • 秒懂C++之特殊类设计
  • 人工智能学习
  • WINDOWS AGENTARENA:EVALUATING MULTI-MODAL OS AGENTS AT SCALE论文学习
  • 3步轻松定制报价方案,亿发商城报价神器你用过了吗?
  • CISP备考题库(五)
  • 【Kubernetes】常见面试题汇总(二十三)
  • linux-Shell 编程-Shell 脚本基础
  • Linux运维篇-tigervnc工具的使用
  • 基于Spark的电影推荐系统设计与实现(论文+源码)_kaic