当前位置: 首页 > news >正文

李宏毅(Deep Learning)--(三)

一.前向传播与反向传播的理解:

 

二.模型训练遇到的问题

在模型训练中,我们可能会遇到效果不好的情况,那么我们应该怎么思考切入,找到问题所在呢?

流程图如下:

第一个就是去看训练的损失函数值情况。如果损失较大,那么就有可能是两种情况:
(1)模型过于简单:如图:当你设计的模型所能拟合的函数集合(蓝色区域)这么大时,即使你找了蓝色区域内最优的函数(optimization最优),但是真正完美拟合的函数不能通过该模型拟合(不在蓝色区域内),所以loss较大。

(2) optimization效果不佳(梯度下降难以到达最优解)

基于以上情况,我们怎么去判别呢?(我们可以去增加模型的复杂度,如果新模型的loss在training data上比原model还高,那就说明是optimization的问题了)

假如经过努力,你已经可以让training data的loss变得小了,这时我们看testing data的loss,假如我们发现testing data的loss较大,这时候也有两种可能得原因:

(1) over fitting :在training data上的loss好,在testing 上的loss差(缺一不可)才叫过拟合

比如:如上图,所有的data拟合的预期目标函数是二次函数,但由于 某些原因(原因很多,这里暂不探讨),导致拟合的函数虽然能够在有training data限制的地方,表现的很好,但是在其他地方是随机预测的(函数弹性过大,如黑色箭头所指函数),这使得testing data在该函数的loss较大

解决方法:add training data or data augmentation or regularation

今天先学到这啦

谢谢

http://www.lryc.cn/news/586305.html

相关文章:

  • Git企业级开发(多人协作)
  • 网络编程员工管理系统
  • 商业机密保卫战:如何让离职员工带不走的客户资源?
  • 独立开发第二周:构建、执行、规划
  • 手把手教你用YOLOv10打造智能垃圾检测系统
  • 从OpenMV到执行器:当PID算法开始“调教”舵机
  • 微服务环境下的灰度发布与金丝雀发布实战经验分享
  • 数据分析库 Pandas
  • 【离线数仓项目】——电商域DWD层开发实战
  • AI之DL之VisualizationTool:ai-by-hand-excel的简介、安装和使用方法、案例应用之详细攻略
  • 用 Python 将分组文本转为 Excel:以四级词汇为例的实战解析
  • Ether and Wei
  • 实用技巧 Excel 与 XML互转
  • Python ExcelWriter详解:从基础到高级的完整指南
  • Flink创建执行环境的三种方式,也是Flink搭建程序的第一步
  • Python数据容器-集合set
  • 学习笔记 Datewhale MCP Server Task2
  • 【Redis实战】Widnows本地模拟Redis集群的2种方法
  • 【嵌入式】51单片机学习笔记-Keil5软件安装教程
  • 启动Haproxy失败,如何排查问题
  • 深度聚焦:潜在学员转化与流失管理——提升销售流程闭环
  • C语言<数据结构-单链表>(收尾)
  • 缓存三剑客解决方案
  • BaseDao 通用查询方法设计与实现
  • Raft 代码分析
  • 区块链平台之以太坊深入解读:技术、经济与生态的全面解析
  • el-tree 懒加载 loadNode
  • 可穿戴智能硬件在国家安全领域的应用
  • 【设计模式】装饰(器)模式 透明装饰模式与半透明装饰模式
  • Lua ADB 接口文档