当前位置: 首页 > news >正文

机器学习-03(机器学习任务攻略)

对于训练出来的模型不满意:

1.检查训练所使用的数据 

训练数据的Loss 过大

model bias(模型过于简单,模型偏差)

所求出的任何\theta,带入函数之后都不能使Loss变得足够低。可以让Loss变低的函数不在求出的函数集合之中。

解决方法:重新设计模型,增加层数,使其更有弹性。比如可以增加输入的特征。

最佳化问题(Optimization Issue)处理的不好

因为目前使用的gradient descent没有给出最佳的函数。

解决方法: 

当训练数据的Loss不够低时,如何判断是以上情况的哪种?

通过比较不同的模型,得知目前的模型是否足够大,层数是否够多。

56层的弹性一定比20层大,故一定是最佳化的问题。不是过拟合或者模型偏差的问题。

从小的(层数少的)模型入手,过渡到层数更多的模型。如果层数多的模型比层数小的模型的Loss还要大,那么就是最佳化出现了问题。

训练数据的Loss已经变小

测试数据的Loss小

此结果是我们想要的结果

测试数据的Loss大
overfitting问题(过拟合)

过拟合是指模型在训练数据上表现非常好,但在测试数据上表现较差。这通常是因为模型过于复杂,学习了训练数据中的噪声和细节,而未能提取数据的普遍规律,导致泛化能力差。

只有训练数据Loss小,但是测试数据Loss大才是过拟合问题。

极端的例子:

解决方法:

1.增加训练资料(训练数据)

2.不要让模型具有太大的弹性,给予其一些限制。 比如说给其较少的参数,在深度学习方面可以给其较少的神经元数目(但不能给太多的限制)

 

mismatch(数据不匹配)问题

训练资料和测试资料分布不同,增加训练资料不能解决此问题。

http://www.lryc.cn/news/579654.html

相关文章:

  • 边缘计算解决方案:数据中心机房IT设备数据采集与调优
  • STM32-PWM驱动无源蜂鸣器
  • 使用numpy的快速傅里叶变换的一些问题
  • AI+软件测试——03软件的缺陷及管理
  • 一、Docker:一场颠覆应用部署与运维的容器革命
  • 数学建模_时间序列
  • 月更!2025年7月鼠标入门及选购推荐(含无线鼠标、游戏鼠标)
  • 百度文心大模型 4.5 系列全面开源 英特尔同步支持端侧部署
  • 两个PHY芯片之间,是如何连接进行通信的?
  • Python Pytest-Benchmark详解:精准性能测试的利器
  • 两个手机都用同个wifi,IP地址会一样吗?如何更改ip地址
  • 禁止ifrmare标签上的文件,实现自动下载功能,并且隐藏工具栏
  • 搭建VirtualBox-6+vagrant_2+docker+mysql5.7的步骤
  • 代码随想录算法训练营第四十四天|动态规划part11
  • 人形机器人九大发展趋势预判
  • EXCEL动态表格
  • Python 爬虫实战 | 国家医保
  • 【字节跳动】数据挖掘面试题0007:Kmeans原理,何时停止迭代
  • 深度解析:Java内部类与外部类的交互机制
  • BitsAndBytesConfig量化及注意事项
  • Mysql锁机制与优化实践以及MVCC底层原理剖析
  • Unity单元测试框架在keil环境下的移植教程
  • Unity3D 文件夹注释工具
  • CTF Web的数组巧用
  • 互联网大厂Java面试实录:Spring Boot与微服务在电商场景中的应用
  • STM32-第二节-GPIO输入(按键,传感器)
  • Linux基本指令(下)
  • 建设工程停工损失从哪些方面取证,如何取证?
  • 经典灰狼算法+编码器+双向长短期记忆神经网络,GWO-Transformer-BiLSTM多变量回归预测,作者:机器学习之心!
  • 在鸿蒙(HarmonyOS)中安装 .app 格式的应用包(即 HAP 或 APP 文件),可以通过以下方法实现