当前位置：首页 > news >正文

机器学习任务功略

news 2025/8/22 8:29:30

loss如果大，训练资料没有学好，此时有两个可能：

1.model bias太过简单（找不到loss低的function）。

解决办法：增加输入的feacture，设一个更大的model，也可以用deep learning增加弹性。

2.optimization做得不好（合适的function确实存在但是无法正确选择出来）。

如何判断是上面的哪种情况？

比较图像信息。（例如如果20层的network已经可以做得很好有很低的loss了，56层的明显错误便并不是model bias弹性不够导致的，是optimization做得不好）
可以先看比较浅的network（model），因为它们不太会有optimization的问题。
如果深层的model并没有包含更小的数据差，那就是optimization的问题。（例如↓）

看testing data

1.依旧很小，那很完美。

2.如果training data的loss小（并且确定model bias没有问题，optimization够大了）但是testing data的loss大有可能是overfitting。

上面是个特例极端情况。
正常来说：没有给足够的资料做为训练，因为model自由度很大就会导致overfitting。

解决方法：

1.增加训练资料。

2.data augmentation（用自己对问题的理解自己创造一些资料）。

注意：不能随便做，要是有道理的数据。根据对资料的特性，基于自己的理解，增加data augmentation。

3.缩减弹性，写极限。

比如：减少神经元数目或者让model公用参数或者用比较少的features 或者 early stopping 或者 regularization 或者 drop out。

但是注意不要给模型太多的限制。限制太大了在测试上就没有好结果，也就导致了model bias。

http://www.lryc.cn/news/496266.html

相关文章：

Web Worker 和 WebSocket的区别

JMeter实时性能压测可视化系统整合

无限加载和懒加载及路由滚动及路由滚动不生效

CSS底层基础：小白速来

【MySQL 进阶之路】索引概述

【C++boost::asio网络编程】有关异步读写api的笔记

Elasticsearch 的存储与查询

008静态路由-特定主机路由

SystemUI 下拉框 Build 版本信息去掉

【JS】栈内存、堆内存、事件机制区别、深拷贝、浅拷贝

如何确保Java爬虫获得1688商品详情数据的准确性

【蓝牙通讯】iOS蓝牙开发基础介绍

Vue 90 ，Element 13 ，Vue + Element UI 中 el-switch 使用小细节解析，避免入坑（获取后端的数据类型自动转变）

echarts的双X轴，父级居中的相关配置

RuoYi-Vue部署到Linux服务器(Jar+Nginx)

Linux firewalld常用命令

Vue 组件之间的通信方式

el-select 修改样式

Java项目实战II基于微信小程序的亿家旺生鲜云订单零售系统的设计与实现（开发文档+数据库+源码）

算法训练营day27(回溯算法03:组合总和,组合总和2,分割回文串)

【青牛科技】D8331 流量计电路芯片，兼容 CTs，电阻分流器和罗氏线圈传感器

R语言森林生态系统结构、功能与稳定性分析与可视化实践高级应用

【IntelliJ IDEA 中 Run Dashboard 不显示端口号问题解决办法】

idea中git的将A分支某次提交记录合并到B分支

华为关键词覆盖应用市场ASO优化覆盖技巧

蓝桥杯第 23 场小白入门赛

rest-assured multiPart上传中文名称文件，文件名乱码

CSFramework.EF高级应用： ASP.NETCore/WebApi使用动态代理技术创建多个IDatabase数据库实例

神经网络入门实战：（九）分类问题 → 神经网络模型搭建模版和训练四步曲

Unity网络框架对比 Mirror|FishNet|NGO