当前位置: 首页 > news >正文

深度学习(6):Dataset 和 DataLoader

文章目录

  • Dataset 类
  • DataLoader 类

Dataset 类

概念:

  • Dataset 是一个抽象类,用于表示数据集。它定义了如何获取数据集中的单个样本和标签。

作用:

  • 为数据集提供统一的接口,便于数据的读取、预处理和管理。

关键方法:

  • __len__(self): 返回数据集的大小(样本数量)。
  • __getitem__(self, index): 根据索引 index 返回对应的样本和标签。

自定义 Dataset:

需要继承 torch.utils.data.Dataset并实现上述两个方法。

示例(PyTorch):

import torch
from torch.utils.data import Datasetclass Dataset(Dataset):def __init__(self, datas, labels):self.datas = datas # 数据文件路径列表self.labels = labels # 标签列表def __len__(self):return len(self.data)def __getitem__(self, idx):# 加载数据,例如读取图像文件data = self.data[idx]label = self.labels[idx]# 一系列的处理return data, label

DataLoader 类

概念:

  • DataLoader 是一个数据迭代器,用于包装 Dataset,以便于批量(batch)加载数据。

作用:

  • 提供批量数据、数据打乱(shuffle)、并行加载(多线程/多进程)等功能,提高数据加载的效率。

关键参数:

  • dataset: 要加载的数据集(Dataset 实例)。
  • batch_size: 每个批次的样本数量。
  • shuffle: 是否在每个 epoch 开始时打乱数据。
  • num_workers: 使用多少子进程来加载数据(0 表示不使用多进程)。
  • collate_fn: 指定如何将一批样本组合成一个批次。

工作流程:

  • Dataset 中按索引取出样本。
  • 使用 collate_fn 将多个样本组合成一个批次。
  • 迭代返回批量数据供模型训练或评估。

示例(PyTorch):

from torch.utils.data import DataLoader# 创建 Dataset 实例
dataset = MyDataset(datas, labels)# 创建 DataLoader 实例
dataloader = DataLoader(dataset, batch_size=32, shuffle=True, num_workers=4)

http://www.lryc.cn/news/446028.html

相关文章:

  • Qt窗口——QToolBar
  • MySQL—存储过程详解
  • 2024ICPC网络赛2记录:CK
  • PerparedStatement概述
  • 联影医疗嵌入式面试题及参考答案(3万字长文)
  • Rust的作用?
  • 无人机之可承受风速的影响因素
  • HTML与JavaScript结合实现简易计算器
  • Docker网络原理
  • PyTorch 目标检测教程
  • 校园美食导航:Spring Boot技术的美食发现之旅
  • 51单片机 - DS18B20实验1-读取温度
  • go语言基础入门(一)
  • linux 基础(一)mkdir、ls、vi、ifconfig
  • DAMODEL丹摩智算:LLama3.1部署与使用
  • Spring Boot 配置全流程 总结
  • 爬虫技术初步自学
  • 【力扣 | SQL题 | 每日三题】力扣175, 176, 181
  • SpringBoot使用hutool操作FTP
  • 如何防止SQL注入攻击
  • Java List类
  • 使用 Internet 共享 (ICS) 方式分配ip
  • SMTP/IMAP服务发在线邮件时要用到
  • Threejs绘制圆锥体
  • 速通LLaMA3:《The Llama 3 Herd of Models》全文解读
  • Python网络爬虫获取Wallhaven壁纸图片(源码)
  • 智能化引领等保测评新时代:AI与大数据的深度融合
  • 深入解析:HTTP 和 HTTPS 的区别
  • 《动手学深度学习》笔记1.11——实战Kaggle比赛:预测房价+详细代码讲解
  • 数据结构:单链表实现信息管理