当前位置: 首页 > news >正文

2.10 模型评估的方法有哪些?优缺点

2.10 模型评估的方法有哪些?优缺点?

场景描述
在机器学习中,我们通常把样本分为训练集测试集,训练集用于训练模型,测试集用于评估模型。在样本划分和模型验证的过程中,存在着不同的抽样方法和验证方法。本小节主要考察面试者是否熟知这些方法及其优缺点、是否能够在不同问题中挑选合适的评估方法
知识点
Holdout检验,交叉验证,自助法(Bootstrap),微积分

在模型评估过程中,有哪些主要的验证方法,它们的优缺点是什么?

1. Holdout检验

Holdout检验是最简单也是最直接的验证方法,它将原始的样本集合随机划分训练集验证集两部分。

比方说,对于一个点击率预测模型,我们把样本按照 70%∼30% 的比例分成两部分,70%的样本用于模型训练;30%的样本用于模型验证,包括绘制ROC曲线、计算精确率和召回率等指标来评估模型性能。

缺点:Holdout检验的缺点很明显,即在验证集上计算出来的最后评估指标与原始分组有很大关系。为了消除随机性,研究者们引入了“交叉检验”的思想。

2. 交叉检验

k-fold交叉验证:首先将全部样本划分成k个大小相等的样本子集;依次遍历这k个子集,每次把当前子集作为验证集,其余所有子集作为训练集,进行模型的训练和评估;最后把k次评估指标的平均值作为最终的评估指标。在实际实验中,k经常取 10。

留一验证:每次留下1个样本作为验证集,其余所有样本作为测试集。样本总数为n,依次对n个样本进行遍历,进行n次验证,再将评估指标求平均值得到最终的评估指标。在样本总数较多的情况下,留一验证法的时间开销极大。

事实上,留一验证是留p验证的特例。留p验证是每次留下p个样本作为验证集,而从n个元素中选择p个元素有C”种可能,因此它的时间开销更是远远高于留一验证,故而很少在实际工程中被应用。

3. 自助法

​ 不管是Holdout检验还是交叉检验,都是基于划分训练集和测试集的方法进行模型评估的。然而,当样本规模比较小时,将样本集进行划分会让训练集进一步减小,这可能会影响模型训练效果。有没有能维持训练集样本规模的验证方法呢?自助法可以比较好地解决这个问题。
​ 自助法是基于
自助采样法
的检验方法。对于总数为n的样本集合,进行n次有放回的随机抽样,得到大小为n的训练集。n次采样过程中,有的样本会被重复采样,有的样本没有被抽出过,将这些**没有被抽出的样本作为验证集,**进行模型验证,这就是自助法的验证过程。

在自助法的采样过程中,对n个样本进行n次自助抽样,当n趋于无穷大时,最终有多少数据从未被选择过?

大约有36.8%的样本从未被选择过,可作为验证集。

参考文献:

《百面机器学习》 诸葛越主编

出版社:人民邮电出版社(北京)

ISBN:978-7-115-48736-0

2022年8月第1版(2022年1月北京第19次印刷)

http://www.lryc.cn/news/323669.html

相关文章:

  • Linux centos7安装nginx-1.24.0并且实现自启动
  • 001-Windows下PyTorch极简开发环境配置(上)
  • 分布式Raft原理详解,从不同角色视角分析相关状态
  • 大数据的实时计算和离线计算你理解吗?
  • OS Package Manager
  • 【滑动窗口、矩阵】算法例题
  • 【事务】开发用到的事务,TransactionDefinition实例详解,事务的传播机制
  • Linux信号处理
  • nuclei使用方法
  • 【并查集专题】【蓝桥杯备考训练】:网络分析、奶酪、合并集合、连通块中点的数量、格子游戏【已更新完成】
  • 数据结构(三)复杂度的深层次剖析
  • JavaWeb -- HTTP -- WEB服务器TOMCAT
  • GitHub与Git命令使用笔记
  • 二叉树的层次遍历经典问题-算法通关村
  • SQLiteC/C++接口详细介绍sqlite3_stmt类(十二)
  • 大模型时代如何做安全?
  • 新型储能是什么,储能系统解决方案现状及趋势详细说明
  • 掌握Go语言:Go语言中的字典魔法,高效数据检索与应用实例解析(18)
  • Flutter-仿携程首页类型切换
  • C语言 自定义类型:结构体
  • 计算机网络拓扑结构
  • FPGA通过I2C控制AT24C64
  • 134. 加油站(力扣LeetCode)
  • XSKY 智能存储,助力“数据要素 X”先进制造
  • 数据挖掘与分析学习笔记
  • linux docker镜像初始化
  • 专业140+总分410+南京大学851信号与系统考研经验南大电子信息与通信集成,电通,真题,大纲,参考书。
  • . ./ bash dash source 这五种执行shell脚本方式 区别
  • 【React 】React 性能优化的手段有哪些?
  • 3.22网络编程小项目