当前位置: 首页 > news >正文

RFNet模型数据集采集处理流程

文章目录

  • cityscapes数据集内容
  • 如何标注数据得到标签图片

cityscapes数据集内容

训练模型的时候下载了cityscapes里的disparity、gtFine和leftImg8bit。
在这里插入图片描述
共5000张图片。2975张训练,500张验证,1525test。每个目录下都有train、test和val的子目录,这些子目录下又有一些城市名命名的子目录。train下有18个子文件夹对应德国的16个城市,法国一个城市和瑞士一个城市。train集总共有2975张png格式的大小为2048 x 1024的0-255的RGB图片。val下有3个子文件夹对应德国的3个城市。test下有6个子文件夹对应德国的6个城市。

对于disparity目录,里面放的都是深度图片;对于leftImg8bit里面放的都是原图片;对于gtFine中train目录下含有以下类型的文件:
在这里插入图片描述
文件的命名规则:
在这里插入图片描述

模型在训练的时候用到了哪些数据?

在train.py文件中加载并使用的是train_loader和val_loader。

self.train_loader, self.val_loader, self.test_loader, self.nclass = make_data_loader(args, **kwargs)

train.py中的make_data_loader()在dataloader中的__init__.py中:

def make_data_loader(args, **kwargs):if args.dataset == 'cityscapes':train_set = cityscapes.CityscapesSegmentation(args, split='train')val_set = cityscapes.CityscapesSegmentation(args, split='val')test_set = cityscapes.CityscapesSegmentation(args, split='test')num_class = train_set.NUM_CLASSEStrain_loader = DataLoader(train_set, batch_size=args.batch_size, shuffle=True, **kwargs)val_loader = DataLoader(val_set, batch_size=args.val_batch_size, shuffle=False, **kwargs)test_loader = DataLoader(test_set, batch_size=args.test_batch_size, shuffle=False, **kwargs)return train_loader, val_loader, test_loader, num_class

cityscapes.py中的CityscapesSegmentation():

 self.images_base = os.path.join(self.root, 'leftImg8bit', self.split)self.disparities_base = os.path.join(self.root, 'disparity', self.split)self.annotations_base = os.path.join(self.root, 'gtFine', self.split)self.images[split] = self.recursive_glob(rootdir=self.images_base, suffix='.png')self.images[split].sort()self.disparities[split] = self.recursive_glob(rootdir=self.disparities_base, suffix='.png')self.disparities[split].sort()self.labels[split] = self.recursive_glob(rootdir=self.annotations_base, suffix='labelTrainIds.png')self.labels[split].sort()

从代码中可以看到从leftImg8bit读取原图片,从disparity读取深度图片,从gtFine读取标签图片。其中标签图片是灰度图,灰度值就是种类对应的标签值。

所以制作自己的数据集需要原RGB图片、深度图片、标签图片。如何得到标签图片?cityscapes提供了标注工具获得josn文件,再将josn文件转为labelTrainIds.png。

如何标注数据得到标签图片

1.可以利用github上提供的标注工具
2.也可以利用labelme标注
这里选择labelme,创建文件夹images,里面放rgb图片和label.txt(里面放标签),再创建文件夹labels,把标注好的json文件存在这里。
标注的时候点物体的轮廓,点回到第一个点的时候形成闭合区域,弹出对话框选择种类。
在这里插入图片描述
得到josn文件后,要进行一下处理。因为labelme生成的josn和原数据集的josn并不一样。一种方法是修改生成的josn文件,一种方法是修改原代码。为了以后更方便,不用标注过后再进行一次json处理,这里直接修改源代码。主要修改对应的key值,目录地址。
在这里插入图片描述

利用citscapesscripts生成标签图片。先修改/helper/labels.py中的标签,然后把数据集的目录给/preparation/createTrainIdLabelImgs.py,生成标签图片。标注了两张图片得到json测试得到如下结果:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
为更高效的标注可以先试用分割模型输出分割结果josn文件,然后人为进行修正即可。

http://www.lryc.cn/news/210352.html

相关文章:

  • sql-50练习题6-10
  • 【刷题宝典NO.1】
  • 如何在深度学习领域取得个人的成功
  • 数据结构【DS】B树
  • Chatgpt网页版根据关键词自动批量写原创文章软件【可多开自动登录切换gpt账号】
  • 研发效能认证学员作品:快速进行持续集成应用实践丨IDCF
  • 中文编程开发语言工具系统化教程零基础入门篇和初级1专辑课程已经上线,可以进入轻松学编程
  • 2024年最新水果音乐制作软件FL Studio21需要多少钱呢?
  • 当生成式AI遇到业务流程管理,大语言模型正在变革BPM
  • Kotlin数据流概览
  • npm : 无法加载文件 C:\Program Files\nodejs\npm.ps1,因为在此系统上禁止运行脚本。
  • 036-第三代软件开发-系统时间设置
  • C语言:杨氏矩阵、杨氏三角、单身狗1与单身狗2
  • PX4天大bug,上电反复重启,连不上QGC!
  • 归并排序——
  • 阿里云企业邮箱基于Spring Boot快速实现发送邮件功能
  • 大数据Doris(十三):创建用户和创建数据库并赋予权限
  • 【Unity小技巧】可靠的相机抖动及如何同时处理多个震动
  • Megatron-LM GPT 源码分析(四) Virtual Pipeline Parallel分析
  • IOC课程整理-8 Spring Bean作用域
  • 本地websocket服务端暴露至公网访问【内网穿透】
  • C/C++跨平台构建工具CMake-----灵活添加库并实现开发和生产环境的分离
  • javascript判断对象中是否存在某个字段
  • 网络基础-2
  • 【MySQL索引与优化篇】索引的分类与设计原则
  • 基于Java的民航售票管理系统设计与实现(源码+lw+部署文档+讲解等)
  • 应用案例|基于三维机器视觉的机器人引导电动汽车充电头自动插拔应用方案
  • 基于Java的流浪动物救助管理系统设计与实现(源码+lw+部署文档+讲解等)
  • 关于错误javax.net.ssl.SSLException: Received close_notify during handshake
  • JAVA实现校园失物招领管理系统 开源