当前位置: 首页 > news >正文

【论文阅读】Computing the Testing Error without a Testing Set

https://blog.csdn.net/qq_40021158/article/details/109485216

可以使用测试集来估计训练集和测试集之间的性能差距,但是要避免过度拟合测试数据几乎是不可能的。 使用隔离的测试集可能会解决此问题,但这需要不断更新数据集,这是一项非常昂贵的尝试。
在这里,我们推导出了一种算法,用于估计不需要任何测试集的训练和测试之间的性能差距。 具体来说,我们推导出了许多持久性拓扑度量,这些度量可确定何时DNN可以学习推广到看不见的样本。这样,即使我们无法访问这些样本,我们也可以计算出DNN的测试误差。

在这里插入图片描述
a)我们不使用任何测试样本在任何计算机视觉问题上计算任何深度神经网络(DNN)的测试性能1(顶部); 标记和未标记的样本都是没有必要的。 这与传统计算机视觉方法形成鲜明对比,传统计算机视觉方法使用选定的测试数据集(底部)来计算模型性能。 (b)我们的算法(x轴)针对训练与测试性能(y轴)之间的性能差距∆ρ给出的持久代数拓扑概要( The persistent algebraic topological summary)( λ , µ ) 。

我们提出的假设是,泛化误差是网络内部工作的函数,此处由网络的功能拓扑表示并通过拓扑概要进行描述。 我们建议对这个函数进行回归,并仅在训练数据上评估测试性能。

图1(b)展示了一个例子。 在此图中,x轴显示了DNN的持久拓扑度量的线性组合。 此图中的y轴是在多个计算机视觉问题上使用这些DNN时的性能差距∆ρ。 从该图中可以看出,我们提出的拓扑概要与DNN的性能差距之间存在线性关系。 这意味着了解我们的拓扑概要的价值与了解DNN在隔离的数据集上的性能一样好,但没有上述任何缺点–无需依赖独立的团队来收集,管理和更新测试集。

具体细节

在这里插入图片描述
计算两两神经元之间的相关性
在这里插入图片描述

一个DNN可以得到一个相关性矩阵,从而可以构造PH

基于此持久性图,我们将腔的生命定义为该图中的平均时间(即持久性)。公式地,
在这里插入图片描述
同样,我们将其中年定义为持久性的平均密度。 公式地,
在这里插入图片描述
最后,我们定义了从这些拓扑概要到训练误差与测试误差之间的差值的线性函数映射,
在这里插入图片描述
在这里插入图片描述
根据以上结果,我们可以估算出测试误差,而无需任何测试数据,即
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/505887.html

相关文章:

  • Visio——同一个工程导出的PDF文件大小不一样的原因分析
  • 【ETCD】ETCD 架构揭秘:内部各组件概览
  • Qt WORD/PDF(四)使用 QAxObject 对 Word 替换(QWidget)
  • 音视频学习(二十四):hls协议
  • UniDepth 学习笔记
  • PVE——OpenWRT 硬盘 size单位的调整
  • Android-ImagesPickers 拍照崩溃优化
  • Linux dd 命令详解:工作原理与实用指南(C/C++代码实现)
  • Golang学习历程【第一篇 入门】
  • 青少年编程与数学 02-004 Go语言Web编程 01课题、Web应用程序
  • 【mysql】如何解决主从架构从库延迟问题
  • 前端学习-获取DOM对象(二十一)
  • PCL点云库入门——PCL库中Eigen数学工具库的基本使用(持续更新)
  • CLion Inlay Hints - 取消 CLion 灰色的参数和类型提示
  • 2025山东科技大学考研专业课复习资料一览
  • vue3 v-model实例之二,tab标签页的实现
  • 东方通TongWeb7.0.4.9M4部署SuperMap iServer 11.2.1
  • QT绘制同心扇形
  • 2012年西部数学奥林匹克试题(几何)
  • 8位移位寄存器的verilog语言
  • 【苍穹外卖】学习心得体会-随笔
  • MySQL学习之表的增删改
  • 电脑excel词典(xllex.dll)文件丢失是或损坏是什么原因?“xllex.dll文件缺失“要怎么解决?
  • 【CSS in Depth 2 精译_084】第 14 章:CSS 蒙版、形状与剪切概述 + 14.1:CSS 滤镜
  • gorm源码解析(四):事务,预编译
  • 前端优雅(装逼)写法(updating····)
  • 黑马Java面试教程_P7_常见集合_P4_HashMap
  • 使用 CFD 加强水资源管理:全面概述
  • XXE练习
  • R语言读取hallmarks的gmt文档的不同姿势整理