当前位置: 首页 > news >正文

深度学习(YOLO、DETR) 十折交叉验证

二:交叉验证

在 K 折验证之前最常用的验证方法就是交叉验证,即把数据划分为训练集、验证集和测试集。一般的划分比例为 7:1:2。但如何合理的抽取样本就成为了使用交叉验证的难点,不同的抽取方法会导致截然不同的训练性能。同时由于验证机和训练集是不参与训练的,导致大量的数据无法应用于学习,所以显而易见的会导致训练的效果下降。

二:K 折交叉验证

将训练集数据划分为 K 部分,利用其中的 K-1 份做为训练,剩余的一份作为测试,最后取平均测试误差做为泛化误差。这样做的好处是,训练集的所有样本都必然会成为训练数据同时页必然有机会成为一次测试集。可以更好的利用训练集数据。

K 越大,平均误差被视为泛化误差这个结果就越可靠,但相应的所花费的时间也是线性增长的。

上图 中 划分测试、训练、验证的时候 平均分成10份   7份训练 1份验证 2份测试 。

按照顺序循环成一个圈  代码如下:

import os
import shutil
import numpy as np#文件地址
postfix = 'jpg'
imgpath = 'D:\\dataset\\images'
txtpath = 'D:\\dataset\\txt'# 创建存储交叉验证结果的基础目录
os.makedirs('cross_validation', exist_ok=True)# 获取文件列表并按文件名排序
listdir = np.array(sorted([i for i in os.listdir(txtpath) if i.endswith('.txt')], key=lambda x: int(x[:-4])))# 将文件列表等分为10份
folds = np.array_split(listdir, 10)# 进行10次交叉验证
for fold in range(10):# 初始化训练、验证、测试集索引train_indices = []val_indices = []test_indices = []# 训练集索引for i in range(7):index = (fold + i) % 10train_indices.extend(folds[index])# 验证集索引val_index = (fold + 7) % 10val_indices.extend(folds[val_index])# 测试集索引test_indices.extend(folds[(fold + 8) % 10])test_indices.extend(folds[(fold + 9) % 10])# 打印每次折的训练集、验证集和测试集的大小print(f'Fold {fold + 1}:')print(f'  Train set size: {len(train_indices)}')print(f'  Validation set size: {len(val_indices)}')print(f'  Test set size: {len(test_indices)}')# 为当前折创建目录fold_dir = f'cross_validation/fold_{fold + 1}'os.makedirs(f'{fold_dir}/images/train', exist_ok=True)os.makedirs(f'{fold_dir}/images/val', exist_ok=True)os.makedirs(f'{fold_dir}/images/test', exist_ok=True)os.makedirs(f'{fold_dir}/labels/train', exist_ok=True)os.makedirs(f'{fold_dir}/labels/val', exist_ok=True)os.makedirs(f'{fold_dir}/labels/test', exist_ok=True)# 将文件复制到当前折的训练、验证和测试目录中for i in train_indices:img_file = f'{imgpath}/{i[:-4]}.jpg'lbl_file = f'{txtpath}/{i}'shutil.copy(img_file, f'{fold_dir}/images/train/{i[:-4]}.jpg')shutil.copy(lbl_file, f'{fold_dir}/labels/train/{i}')for i in val_indices:img_file = f'{imgpath}/{i[:-4]}.jpg'lbl_file = f'{txtpath}/{i}'shutil.copy(img_file, f'{fold_dir}/images/val/{i[:-4]}.jpg')shutil.copy(lbl_file, f'{fold_dir}/labels/val/{i}')for i in test_indices:img_file = f'{imgpath}/{i[:-4]}.jpg'lbl_file = f'{txtpath}/{i}'shutil.copy(img_file, f'{fold_dir}/images/test/{i[:-4]}.jpg')shutil.copy(lbl_file, f'{fold_dir}/labels/test/{i}')

    images和txt文件夹下存放文件,没有任何子文件夹

http://www.lryc.cn/news/428942.html

相关文章:

  • 基于php网上差旅费报销系统设计与实现
  • 微服务及安全
  • 图文详解ThreadLocal:原理、结构与内存泄漏解析
  • 基于java的综合小区管理系统论文.doc
  • 如何合理设置PostgreSQL的`max_connections`参数
  • Kubectl 常用命令汇总大全
  • 【Linux】Linux环境基础开发工具使用之Linux调试器-gdb使用
  • clickhouse_driver
  • BI分析实操案例分享:零售企业如何利用BI工具对销售数据进行分析?
  • python : Requests请求库入门使用指南 + 简单爬取豆瓣影评
  • 宋红康JVM调优思维导图
  • linux 网卡配置
  • IEEE |第五届机器学习与计算机应用国际学术会议(ICMLCA 2024)
  • 【网络安全】漏洞挖掘:IDOR实例
  • vue项目执行 cnpm install 报错证书过期的解决方案
  • XGboost的安装与使用
  • 【AI趋势9】开源普惠
  • 【Spark集群部署系列一】Spark local模式介绍和搭建以及使用(内含Linux安装Anaconda)
  • 泛微OA 常用数据库表
  • 宜佰丰超市进销存管理系统
  • 生成Vue脚手架报错:npm error code ETIMEDOUT
  • Readiness Probe可以解决应用启动慢造成访问异常的问题。
  • 第一批AI原住民开始变现:9岁小学生,用大模型写书赚1个w
  • 电路笔记(PCB):串扰的原理与减少串扰的几种方法
  • QT-监测文件内容重复工具)
  • 振兴杯全国青年职业技能大赛信息通信网络线务员解决方案
  • Ai音频文件转文字工具 会议音频转文字 录音转文字提取工具 下载
  • 深入理解Spring Boot日志框架与配置
  • WPF——动态排名图表实现
  • reactive() 的局限性