当前位置: 首页 > news >正文

5. Dataloader 自定义数据集制作

1. 什么是Dataloader 

random shuffle 做一个随机打乱,一个一个 batch 从 queue 中取数据,这里需要能够快速的把数据打包好给训练器。

Dataloader 就是 pytorch 提供的一种 非常快速的供给数据 的方法。

2. 详细组成

以上节的花朵图片分类为例

2.1 读取txt文件中的路径和标签

txt的部分数据

分隔符是“空格”,外部用 list 组织起来,每行都存到 list 中,最后根据 k/v 存到字典中返回。

 dataloader 中需要有两个list,一个是图像路径 list,一个是标签 list。

2.2 分别把数据和标签存在list里

如果只有名字是找不到图片的,需要路径

2.3 设置图像数据路径

2.4 把上面几个写在一起

构造函数:

  1. 构造两个list,图像路径和标签
  2. transform是预处理

getitem:
他会一个一个数据处理去返回一个batch,每次调用它会传一个随机的idx,会找到idx指向的图片、标签,然后图像做个预处理(包括了转成tensor),标签直接读成tensor,然后返回。

2.5 数据预处理(transform)

这个和上节讲的差不多

3. 实例化dataloader

用torch自带的DataLoader方法实例化。

4. 先实验以下,整个数据和标签对不对的上

构造好之后这个dataloader需要进一步检查

每次 next 就会取一个batch的数据。这里取一个图片,然后看看对应的标签是什么,检查对不对。

之后的步骤和上节是一样的。只是单纯的用了我们自己定义的 dataloader

http://www.lryc.cn/news/625571.html

相关文章:

  • C语言基础:(十八)C语言内存函数
  • java17学习笔记-Deprecate the Applet API for Removal
  • 算法——质数筛法
  • yolov5s.onnx转rk模型以及相关使用详细教程
  • 假设检验的原理
  • python的社区互助养老系统
  • word如何转换为pdf
  • MFC中使用EXCEL的方法之一
  • ios使用saveVideoToPhotosAlbum 保存视频失败提示 invalid video
  • 基于单片机的智能声控窗帘
  • 437. 路径总和 III
  • Qt 插件开发全解析:从接口定义,插件封装,插件调用到插件间的通信
  • SWMM排水管网水力、水质建模及在海绵与水环境中的应用
  • 第5章 高级状态管理
  • 结合BI多维度异常分析(日期-> 商家/渠道->日期(商家/渠道))
  • 深入理解 CAS:无锁编程的核心基石
  • nginx安装配置教程
  • 理解JavaScript中的函数赋值和调用
  • Gemini CLI 详细操作手册
  • 传统概率信息检索模型:理论基础、演进与局限
  • JETSON ORIN NANO进阶教程(六、安装使用Jetson-container)
  • elementplus组件文本框设置前缀
  • 网络基础——网络传输基本流程
  • 【服务器】Apache Superset功能、部署与体验
  • C++高频知识点(二十四)
  • 【基础-判断】所有使用@Component修饰的自定义组件都支持onPageShow,onBackPress和onPageHide生命周期函数
  • 一个基于前端技术的小狗寿命阶段计算网站,帮助用户了解狗狗在不同年龄阶段的特点和需求。
  • 【数据结构】二叉树-堆(深入学习 )
  • dockerfile文件中crlf与lf换行符问题
  • 配电网AI识别抓拍装置有哪些突出的功能特点