当前位置：首页 > news >正文

机器学习-03（机器学习任务攻略）

news 2025/7/4 14:47:25

对于训练出来的模型不满意：

1.检查训练所使用的数据

训练数据的Loss 过大

model bias（模型过于简单，模型偏差）

所求出的任何 $\theta$ ，带入函数之后都不能使Loss变得足够低。可以让Loss变低的函数不在求出的函数集合之中。

解决方法：重新设计模型，增加层数，使其更有弹性。比如可以增加输入的特征。

最佳化问题（Optimization Issue）处理的不好

因为目前使用的gradient descent没有给出最佳的函数。

解决方法：

当训练数据的Loss不够低时，如何判断是以上情况的哪种？

通过比较不同的模型，得知目前的模型是否足够大，层数是否够多。

56层的弹性一定比20层大，故一定是最佳化的问题。不是过拟合或者模型偏差的问题。

从小的（层数少的）模型入手，过渡到层数更多的模型。如果层数多的模型比层数小的模型的Loss还要大，那么就是最佳化出现了问题。

训练数据的Loss已经变小

测试数据的Loss小

此结果是我们想要的结果

测试数据的Loss大

overfitting问题（过拟合）

过拟合是指模型在训练数据上表现非常好，但在测试数据上表现较差。这通常是因为模型过于复杂，学习了训练数据中的噪声和细节，而未能提取数据的普遍规律，导致泛化能力差。

只有训练数据Loss小，但是测试数据Loss大才是过拟合问题。

极端的例子：

解决方法：

1.增加训练资料（训练数据）

2.不要让模型具有太大的弹性，给予其一些限制。比如说给其较少的参数，在深度学习方面可以给其较少的神经元数目（但不能给太多的限制）

mismatch（数据不匹配）问题

训练资料和测试资料分布不同，增加训练资料不能解决此问题。

查看全文

http://www.lryc.cn/news/579654.html

边缘计算解决方案：数据中心机房IT设备数据采集与调优

STM32-PWM驱动无源蜂鸣器

使用numpy的快速傅里叶变换的一些问题

AI+软件测试——03软件的缺陷及管理

一、Docker：一场颠覆应用部署与运维的容器革命

数学建模_时间序列

月更！2025年7月鼠标入门及选购推荐（含无线鼠标、游戏鼠标）

百度文心大模型 4.5 系列全面开源英特尔同步支持端侧部署

两个PHY芯片之间，是如何连接进行通信的？

Python Pytest-Benchmark详解：精准性能测试的利器

两个手机都用同个wifi，IP地址会一样吗？如何更改ip地址

禁止ifrmare标签上的文件，实现自动下载功能，并且隐藏工具栏

搭建VirtualBox-6+vagrant_2+docker+mysql5.7的步骤

代码随想录算法训练营第四十四天|动态规划part11

人形机器人九大发展趋势预判

EXCEL动态表格

Python 爬虫实战 | 国家医保

【字节跳动】数据挖掘面试题0007：Kmeans原理，何时停止迭代

深度解析：Java内部类与外部类的交互机制

BitsAndBytesConfig量化及注意事项

Mysql锁机制与优化实践以及MVCC底层原理剖析

Unity单元测试框架在keil环境下的移植教程

Unity3D 文件夹注释工具

CTF Web的数组巧用

互联网大厂Java面试实录：Spring Boot与微服务在电商场景中的应用

STM32-第二节-GPIO输入（按键，传感器）

Linux基本指令（下）

建设工程停工损失从哪些方面取证，如何取证？

经典灰狼算法+编码器+双向长短期记忆神经网络，GWO-Transformer-BiLSTM多变量回归预测，作者：机器学习之心！

在鸿蒙（HarmonyOS）中安装 .app 格式的应用包（即 HAP 或 APP 文件），可以通过以下方法实现