当前位置: 首页 > news >正文

pytorch学习笔记-使用DataLoader加载固有Datasets(CIFAR10),使用tensorboard进行可视化

大概就是DataLoader的基本语法操作吧…毕竟博主也是刚开始学习

import torchvision
from torchvision import transforms, datasets
from torch.utils.tensorboard import SummaryWriter
from torch.utils.data import DataLoader

说明一下下面的transforms虽然只用了一个可以直接写到datasets.CIFAR10里面完全没问题,但是我还是更加建议下面的这样写,感觉是一个更好的习惯,对于以后使用多个transform的组合时很有利~

transfrom的使用具体可以参考上一篇blog

#设置通用transforms
dataset_transfroms = transforms.Compose([transforms.ToTensor()
])test_data = datasets.CIFAR10(root="./dataset",train=False,transform=dataset_transfroms)

num_workers:采用设置的子进程加载数据到内存
drop_last:数据总量对batch_size取余,余数部分是否drop

呃这里为什么要单独列出来一下呢是因为想提醒一下最好drop,因为博主隐约记得自己好像踩过batch_size大小不一样的报错坑(

# num_workers:采用设置的子进程加载数据到内存
# drop_last:数据总量对batch_size取余,余数部分是否drop
test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=True)# img, target = test_data[0]writer = SummaryWriter("dataloader_logs")

注(以下为个人理解,有错欢迎指正):

  1. test_loader是按批次读取的,一次读出的(也就是data)是含有batch_size个图片的
  2. 单次epoch中需要学到所有数据
  3. 内循环中,会将所有数据都遍历到,外层循环中,决定epoch次学习所有数据
  4. 在深度学习训练中,对数据进行打乱,然后多次epoch读取到不同内容组合的batch数据进行学习
# test_loader是按批次读取的,一次读出的(也就是data)是含有batch_size个图片的
# 单次epoch中需要学到所有数据
# 内循环中,会将所有数据都遍历到,外层循环中,决定epoch次学习所有数据
# 在深度学习训练中,对数据进行打乱,然后多次epoch读取到不同内容的batch的数据进行学习
# 添加多张图是add_images
for epoch in range(5):step=0for data in test_loader: imgs, target = datawriter.add_images("epoch_{}".format(epoch),imgs,step)step +=1writer.close()# tensorboard --logdir=dataloader_logs

随便截了不同epoch的最后一个batch构成情况,可以看到内容组合不一样,这是因为我们进行了打乱操作,这样可以保证不同的epoch学习到的batch组合情况不一样
在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/600158.html

相关文章:

  • 前端-html+CSS基础到高级(一)html基础
  • SEO实战派白杨SEO:SEO中说的框计算、知心搜索(知识图谱)是什么?有什么用处?
  • Microsoft SharePointServer 远程命令执行漏洞复现(CVE-2025-53770)
  • 学习笔记《区块链技术与应用》第二天 共识机制
  • Vue2上
  • 机器学习(九):KNN算法全解析与项目实践
  • C/C++---I/O性能优化
  • 谁将统治AI游戏时代?腾讯、网易、米哈游技术暗战
  • 《C++ vector 完全指南:vector的模拟实现》
  • LeetCode|Day25|389. 找不同|Python刷题笔记
  • UE5多人MOBA+GAS 30、技能升级机制
  • 动漫花园资源网在线观看,动漫花园镜像入口
  • 基于Java的健身房管理系统
  • HTTP 与 SpringBoot 参数提交与接收协议方式
  • [MMU]TLB Miss 后的 Hardware Table Walk及优化
  • AI与区块链融合:2025年的技术革命与投资机遇
  • c语言-数据结构-沿顺相同树解决对称二叉树问题的两种思路
  • Web前端:JavaScript Math内置对象
  • ABP VNext + OData:实现可查询的 REST API
  • MyBatis-Plus极速开发指南
  • Springboot3.0 集成 RocketMQ5
  • 理解Spring中的IoC
  • 数字增加变化到目标数值动画,js实现
  • 2025年-ClickHouse 高性能实时分析数据库(大纲版)
  • cha的操作
  • 最新Amos 29下载及详细安装教程,附免激活中文版Amos安装包
  • Nature Communications:复杂光下多维视觉信息处理,利用时间演变的环境极化敏感神经突触器件
  • 基于Docker的GPU版本飞桨PaddleOCR部署深度指南(国内镜像)2025年7月底测试好用:从理论到实践的完整技术方案
  • JavaScript 中 let 在循环中的作用域机制解析
  • 【深度学习新浪潮】Claude code是什么样的一款产品?