当前位置: 首页 > news >正文

Pytorch使用torch.utils.data.random_split拆分数据集,拆分后的数据集状况

对于这个API,我最开始的预想是从 '猫1猫2猫3猫4狗1狗2狗3狗4' 中分割出 '猫1猫2狗4狗1' 和 '猫4猫3狗2狗3' ,但是打印结果和我预想的不一样

数据集文件的存放路径如下图

测试代码如下

import torch
import torchvisiontransform = torchvision.transforms.Compose([torchvision.transforms.Resize((512,512)),  # 调整图像大小为 224x224torchvision.transforms.ToTensor(),  # 转换为张量torchvision.transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # 归一化
])
dataset = torchvision.datasets.ImageFolder('C:\\Users\\ASUS\\PycharmProjects\\pythonProject1\\cats_and_dogs_train',transform=transform)val_ratio = 0.2
val_size = int(len(dataset) * val_ratio)
train_size = len(dataset) - val_size
train_dataset, val_dataset = torch.utils.data.random_split(dataset, [train_size, val_size])cats_num = 0
dogs_num = 0
for x,y in train_dataset:if y == 0:cats_num += 1else:dogs_num += 1print("cats_num: ",cats_num)
print("dogs_num: ",dogs_num)cats_num2 = 0
dogs_num2 = 0
for x,y in val_dataset:if y == 0:cats_num2 += 1else:dogs_num2 += 1print("cats_num2: ",cats_num2)
print("dogs_num2: ",dogs_num2)

输出如下

可以看到总共25000张图片的数据集,分割后并不是cats_num:10000,dogs_num:10000,cats_num2:2500,dogs_num2:2500

也就是说,分割后的状况是猫狗的数量并不一定相等,如结果为 '猫1猫2猫4狗1' 和 '狗4猫3狗2狗3'

http://www.lryc.cn/news/205581.html

相关文章:

  • 每日一练 | 华为认证真题练习Day122
  • SQL sever中函数(2)
  • win10专业版驱动开发
  • 【JavaEE】网络编程---TCP数据报套接字编程
  • 用 Go 访问 MySql 数据库
  • mac 升级node到指定版本
  • 欢迎进QQ群讨论交流
  • C语言解决八皇后问题
  • springboot集成canal,将数据发送至接口
  • Selenum八种常用定位(案例解析)
  • Web前端接入Microsoft Azure AI文本翻译
  • 容联七陌助力鱼跃医疗升级智能联络中心,让客户服务更“鱼跃”
  • 【Redis系列】在Centos7上安装Redis5.0保姆级教程!
  • 线性代数-Python-03:矩阵的变换 - 手写Matrix Transformation及numpy中的用法
  • 【单片机基础】按键状态机实现短按、长按、双击、三击和N击
  • Ubuntu虚拟机部署OpenStack
  • ES在企业项目中的实战总结,彻底掌握ES的使用
  • QT的Qporcess功能的使用
  • 【图灵诸葛】jvm笔记
  • 数据安全小课堂开讲啦!看这里!
  • 单片机矩阵键盘
  • 横坐标日期等间隔绘图 python示例代码
  • photoshop2024免费插件Portraiture3
  • NewStarCTF2023week4-More Fast(GC回收)
  • 和鲸赞助丨第16届中国R会议暨2023 X-AGI大会通知
  • Python第三方库 - Flask(python web框架)
  • c# sqlite 修改字段类型
  • [Pytorch] 保存模型与加载模型
  • AES解密报错,Input length must be multiple of 16 when decrypting with padded cipher
  • 电子学会C/C++编程等级考试2023年05月(三级)真题解析