当前位置: 首页 > news >正文

机器学习任务功略

 loss如果大,训练资料没有学好,此时有两个可能:

1.model bias太过简单(找不到loss低的function)。

解决办法:增加输入的feacture,设一个更大的model,也可以用deep learning增加弹性。

2.optimization做得不好(合适的function确实存在但是无法正确选择出来)。
如何判断是上面的哪种情况?
  • 比较图像信息。(例如如果20层的network已经可以做得很好有很低的loss了,56层的明显错误便并不是model bias弹性不够导致的,是optimization做得不好)
  • 可以先看比较浅的network(model),因为它们不太会有optimization的问题。
  • 如果深层的model并没有包含更小的数据差,那就是optimization的问题。(例如↓)

 看testing data

1.依旧很小,那很完美。
2.如果training data的loss小(并且确定model bias没有问题,optimization够大了)但是testing data的loss大有可能是overfitting。

  • 上面是个特例极端情况。
  • 正常来说:没有给足够的资料做为训练,因为model自由度很大就会导致overfitting。
解决方法:

1.增加训练资料。

2.data augmentation(用自己对问题的理解自己创造一些资料)。

注意:不能随便做,要是有道理的数据。根据对资料的特性,基于自己的理解,增加data augmentation。

3.缩减弹性,写极限。

比如:减少神经元数目 或者 让model公用参数 或者 用比较少的features 或者 early stopping 或者 regularization 或者 drop out。

但是注意不要给模型太多的限制。限制太大了在测试上就没有好结果,也就导致了model bias。

http://www.lryc.cn/news/496266.html

相关文章:

  • Web Worker 和 WebSocket的区别
  • JMeter实时性能压测可视化系统整合
  • 无限加载和懒加载及路由滚动及路由滚动不生效
  • CSS底层基础:小白速来
  • 【MySQL 进阶之路】索引概述
  • 【C++boost::asio网络编程】有关异步读写api的笔记
  • Elasticsearch 的存储与查询
  • 008静态路由-特定主机路由
  • SystemUI 下拉框 Build 版本信息去掉
  • 【JS】栈内存、堆内存、事件机制区别、深拷贝、浅拷贝
  • 如何确保Java爬虫获得1688商品详情数据的准确性
  • 【蓝牙通讯】iOS蓝牙开发基础介绍
  • Vue 90 ,Element 13 ,Vue + Element UI 中 el-switch 使用小细节解析,避免入坑(获取后端的数据类型自动转变)
  • echarts的双X轴,父级居中的相关配置
  • RuoYi-Vue部署到Linux服务器(Jar+Nginx)
  • Linux firewalld常用命令
  • Vue 组件之间的通信方式
  • el-select 修改样式
  • Java项目实战II基于微信小程序的亿家旺生鲜云订单零售系统的设计与实现(开发文档+数据库+源码)
  • 算法训练营day27(回溯算法03:组合总和,组合总和2,分割回文串)
  • 【青牛科技】D8331 流量计电路芯片,兼容 CTs,电阻分流器和罗氏线圈传感器
  • R语言森林生态系统结构、功能与稳定性分析与可视化实践高级应用
  • 【IntelliJ IDEA 中 Run Dashboard 不显示端口号问题解决办法】
  • idea中git的将A分支某次提交记录合并到B分支
  • 华为关键词覆盖应用市场ASO优化覆盖技巧
  • 蓝桥杯第 23 场 小白入门赛
  • rest-assured multiPart上传中文名称文件,文件名乱码
  • CSFramework.EF高级应用: ASP.NETCore/WebApi使用动态代理技术创建多个IDatabase数据库实例
  • 神经网络入门实战:(九)分类问题 → 神经网络模型搭建模版和训练四步曲
  • Unity网络框架对比 Mirror|FishNet|NGO