当前位置：首页 > news >正文

5. Dataloader 自定义数据集制作

news 2025/8/20 7:45:12

1. 什么是Dataloader

random shuffle 做一个随机打乱，一个一个 batch 从 queue 中取数据，这里需要能够快速的把数据打包好给训练器。

Dataloader 就是 pytorch 提供的一种 非常快速的供给数据 的方法。

2. 详细组成

以上节的花朵图片分类为例

2.1 读取txt文件中的路径和标签

txt的部分数据

分隔符是“空格”，外部用 list 组织起来，每行都存到 list 中，最后根据 k/v 存到字典中返回。

dataloader 中需要有两个list，一个是图像路径 list，一个是标签 list。

2.2 分别把数据和标签存在list里

如果只有名字是找不到图片的，需要路径

2.3 设置图像数据路径

2.4 把上面几个写在一起

构造函数：

构造两个list，图像路径和标签
transform是预处理

getitem：
他会一个一个数据处理去返回一个batch，每次调用它会传一个随机的idx，会找到idx指向的图片、标签，然后图像做个预处理（包括了转成tensor），标签直接读成tensor，然后返回。

2.5 数据预处理（transform）

这个和上节讲的差不多

3. 实例化dataloader

用torch自带的DataLoader方法实例化。

4. 先实验以下，整个数据和标签对不对的上

构造好之后这个dataloader需要进一步检查

每次 next 就会取一个batch的数据。这里取一个图片，然后看看对应的标签是什么，检查对不对。

之后的步骤和上节是一样的。只是单纯的用了我们自己定义的 dataloader

查看全文

http://www.lryc.cn/news/625571.html

C语言基础:（十八）C语言内存函数

java17学习笔记-Deprecate the Applet API for Removal

算法——质数筛法

yolov5s.onnx转rk模型以及相关使用详细教程

ios使用saveVideoToPhotosAlbum 保存视频失败提示 invalid video

基于单片机的智能声控窗帘

437. 路径总和 III

Qt 插件开发全解析：从接口定义，插件封装，插件调用到插件间的通信

SWMM排水管网水力、水质建模及在海绵与水环境中的应用

第5章高级状态管理

结合BI多维度异常分析（日期-＞商家/渠道-＞日期（商家/渠道))

深入理解 CAS：无锁编程的核心基石

nginx安装配置教程

理解JavaScript中的函数赋值和调用

Gemini CLI 详细操作手册

传统概率信息检索模型：理论基础、演进与局限

JETSON ORIN NANO进阶教程（六、安装使用Jetson-container）

elementplus组件文本框设置前缀

网络基础——网络传输基本流程

【服务器】Apache Superset功能、部署与体验

C++高频知识点（二十四）

【基础-判断】所有使用@Component修饰的自定义组件都支持onPageShow，onBackPress和onPageHide生命周期函数

一个基于前端技术的小狗寿命阶段计算网站，帮助用户了解狗狗在不同年龄阶段的特点和需求。

【数据结构】二叉树-堆（深入学习）

dockerfile文件中crlf与lf换行符问题

配电网AI识别抓拍装置有哪些突出的功能特点