当前位置: 首页 > news >正文

关于图像分割任务中按照比例将数据集随机划分成训练集和测试集

1. 前言

之前写了分类和检测任务划分数据集的脚本,三大任务实现了俩,基于强迫症,也实现一下图像分割的划分脚本

分类划分数据:关于图像分类任务中划分数据集,并且生成分类类别的josn字典文件

检测划分数据:关于目标检测中按照比例将数据集随机划分成训练集和测试集

之前写了目标检测的可视化脚本,明天看看要不要把分类和分割的可视化也实现一下,之前的博文里实现过,但都是大项目里的一个环节,看看能不能单独实现一下

 

这里的脚本和未划分数据的目录在同一路径

2. 完整代码

如下:

import random
import os
import shutil
from tqdm import tqdm# 划分数据函数
def split_data(root, test_rate):images_path = [os.path.join(root, i) for i in os.listdir(root)]  # 获取所有图片路径test_split_path = random.sample(images_path, k=int(len(images_path) * test_rate))  # 随机采样测试集# 遍历所有图片for image_path in tqdm(images_path, desc='loading...'):# 获取相应的标注文件,这里需要根据目录、后缀更改mask_path = image_path.replace('images', 'masks')# 划分数据if image_path in test_split_path:  # 在测试集shutil.copy(image_path, './data/test/images')shutil.copy(mask_path, './data/test/masks')else:shutil.copy(image_path, './data/train/images')shutil.copy(mask_path, './data/train/masks')if __name__ == '__main__':rawDataSet = './rawDataSet/images'  # 原始数据的图片路径if os.path.exists('./data'):  # 如果之前有,那么删除shutil.rmtree('./data')os.makedirs('./data/train/images')  # 训练集图片os.makedirs('./data/train/masks')   # 训练集标签os.makedirs('./data/test/images')  # 测试集图片os.makedirs('./data/test/masks')   # 测试集标签# 划分数据split_data(root=rawDataSet, test_rate=0.2)

运行过程:这里测试五个数据

运行结果:

 

3. 注意的点

根据训练图片找到对应mask模板的时候,这里要根据目录更换

http://www.lryc.cn/news/275306.html

相关文章:

  • 回文链表【链表】
  • Linux Perf 介绍
  • 【论文阅读】Variational Graph Auto-Encoder
  • 如何把电脑中的项目快速传进Github中?
  • Plantuml之nwdiag网络图语法介绍(二十九)
  • MyBatis接口的方法上使用,定义对应的 SQL 操作
  • (20)Linux初始文件描述符
  • draw.io基础操作和代码高效画图进阶
  • 2024-01-04 用llama.cpp部署本地llama2-7b大模型
  • HTTP打怪升级之路
  • axure RP9.0安装字体图标库fontawesome
  • PiflowX组件-ReadFromUpsertKafka
  • keil 5 ARM CC编译错误和警告解释大全(3)序列号2000-3000
  • CentOS 7 实战指南:文件或目录的权限操作命令详解
  • 我的第一个前端项目,vue项目从零开始创建和运行
  • 【OJ】C++,Java,Python,Go,Rust
  • Flink 任务指标监控
  • Go语言程序设计-第7章--接口
  • 性能优化-OpenMP基础教程(二)
  • 让电脑变得更聪明——用python实现五子棋游戏
  • C#-接口
  • ASP.NET可视化流程设计器源码
  • 景联文科技GPT教育题库:AI教育大模型的强大数据引擎
  • PHP进阶-实现网站的QQ授权登录
  • 字节跳动基础架构SRE-Copilot获得2023 CCF国际AIOps挑战赛冠军
  • python moviepy 图文批量合成带字幕口播视频
  • 【代码片段】Linux C++打印当前函数调用堆栈
  • Linux程序、进程以及计划任务(第一部分)
  • Oracle database 12cRAC异地恢复至单机
  • 【docker】linux部署docker