当前位置: 首页 > news >正文

【pytorch深度学习 应用篇02】训练中loss图的解读,训练中的问题与经验汇总

loss图解析

  • train loss ↘ \searrow 不断下降,test loss ↗ \nearrow 不断上升:原因很多,我是把workers=1,batchSize=8192
  • train loss ↘ \searrow 不断下降,test loss ⇝ \leadsto 趋于不变:说明网络过拟合;
  • train loss ↘ \searrow 不断下降,test loss ↘ \searrow 不断下降: 说明网络仍在学习;
  • train loss ↘ \searrow 不断下降,test loss ↘ ↗ \searrow \; \nearrow 先下降后升高:

  • train loss ⇝ \leadsto 趋于不变,test loss ↗ \nearrow 不断上升,
  • train loss ⇝ \leadsto 趋于不变,test loss ⇝ \leadsto 趋于不变: 说明学习遇到瓶颈,需要减小学习率或批量数目;
  • train loss ⇝ \leadsto 趋于不变,test loss ↘ \searrow 不断下降: 说明数据集100%有问题;

  • train loss ↗ \nearrow 不断上升,test loss ↗ \nearrow 不断上升:说明网络结构设计不当,训练超参数设置不当,数据集经过清洗等问题。
  • train loss ↗ \nearrow 不断上升,test loss ⇝ \leadsto 趋于不变,
  • train loss ↗ \nearrow 不断上升,test loss ↘ \searrow 不断下降,

train loss ↘ \searrow ↗ \nearrow 先降后升

这种情况可能是由于loss函数存在比较奇怪的地方,导致梯度爆炸。参考网址
在这里插入图片描述

http://www.lryc.cn/news/238313.html

相关文章:

  • uniapp 微信小程序如何实现多个item列表的分享
  • .NET 8 正式 GA 遥遥领先
  • 2216. 美化数组的最少删除数 --力扣 --JAVA
  • DDD 领域驱动设计
  • 转型做视频了,博客就是稿子,继续坚持写博客,同时发布视频,能写博客说明思路清晰了,能再讲明白,理解就更透彻了,紧跟上时代发展。
  • 小众市场:探索跨境电商中的利基领域
  • C++中的mutable关键字
  • java: 无效的目标发行版: 17 问题解决
  • C#的LINQ查询
  • Python不会调试不够丝滑?那事你不会logging---剖析!
  • OpenAI的Whisper蒸馏:蒸馏后的Distil-Whisper速度提升6倍
  • Ubuntu18.04安装LeGO-LOAM保姆级教程
  • git修改commit历史提交时间、作者
  • 【C++历练之路】list的重要接口||底层逻辑的三个封装以及模拟实现
  • Kubeadm部署Kubernetes Containerd集群
  • OpenCV入门9——目标识别(车辆统计)
  • 2023前端大厂高频面试题之JavaScript篇(5)
  • 物联网网关在工业行业的应用案例
  • 5、基础入门——资产架构端口应用WAF站库分离负载均衡
  • golang学习笔记——接口和继承比较1
  • chatGPT快捷键(最新版本)
  • 77基于matlab的蚁群优化路径算法,二维路径和三维路径优化
  • PyTorch中并行训练的几种方式
  • 基于非链式(数组)结点结构的二叉树的层序输入创建以及遍历
  • 云计算:开辟数字时代的无限可能
  • Django+Vue项目创建 跑通
  • 2023年中职“网络安全“—Linux系统渗透提权②
  • 多模态大模型训练数据集汇总介绍
  • IDEA中更换java项目JDK
  • C++函数