当前位置: 首页 > news >正文

数据集学习

1,CIFAR-10数据集

CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。
数据集分为五个训练批次和一个测试批次,每个批次有10000个图像。测试批次包含来自每个类别的恰好1000个随机选择的图像。训练批次以随机顺序包含剩余图像,但一些训练批次可能包含来自一个类别的图像比另一个更多。总体来说,所有训练批组成的训练集,每一类都有5000张图。

 

下载地址:https://www.cs.toronto.edu/~kriz/cifar.html 

可视化代码:


import numpy as np
from PIL import Image
import pickle
import os
import matplotlib.image as plimgCHANNEL = 3
WIDTH = 32
HEIGHT = 32data = []
labels=[]
classification = ['airplane','automobile','bird','cat','deer','dog','frog','horse','ship','truck']for i in range(5):with open("./cifar-10-batches-py/data_batch_"+ str(i+1),mode='rb') as file:#数据集在当脚本前文件夹下data_dict = pickle.load(file, encoding='bytes')data+= list(data_dict[b'data'])labels+= list(data_dict[b'labels'])img =  np.reshape(data,[-1,CHANNEL, WIDTH, HEIGHT])#代码创建文件夹,也可以自行创建 
data_path = "./pic3/"
if not os.path.exists(data_path):os.makedirs(data_path)for i in range(100):r = img[i][0]g = img[i][1]b = img[i][2]plimg.imsave("./pic4/" +str(i)+"r"+".png",r)plimg.imsave("./pic4/" +str(i)+"g"+".png",g)plimg.imsave("./pic4/" +str(i) +"b"+".png",b)ir = Image.fromarray(r)ig = Image.fromarray(g)ib = Image.fromarray(b)rgb = Image.merge("RGB", (ir, ig, ib))name = "img-" + str(i) +"-"+ classification[labels[i]]+ ".png"rgb.save(data_path + name, "PNG")

2,cifar100数据集

 这个数据集和cifar10类似,它包含同样的60,000张图像,它有100个类,每个类包含600个图像,600个图像中有500个训练图像和100个测试图像。100类实际是由20个类(每个类又包含5个子类)构成(5*20=100)。

3,ImageNet数据集

  ImageNet数据集是一个计算机视觉数据集,是由斯坦福大学的李飞飞教授带领创建。该数据集包合 14,197,122张图片和21,841个Synset索引。 Synset是WordNet层次结构中的一个节点,它又是 一组同义词集合。 ImageNet数据集一直是评估图像分类算法性能的基准。
  ImageNet 中目前共有 14,197,122 幅图像,总共分为 21,841 个类别(synsets),通常我们所说的 ImageNet 数据集其实是指 ISLVRC2012 比赛用的子数据集,其中 train 有 1,281,167 张照片和标签,共 1000 类,大概每类 1300 张图片,val 有 50,000 副图像,每类 50 个数据,test 有 100,000 副图片,每类 100 个数据。相比CIFAR-10 , ImageNet 数据集图片数量更多, 分辨率更高,含有的类别更多(高上干个图像类别),图片中含高更多的无关噪声和变化,因此识别难度比CIFAR-10 高得多。

http://www.lryc.cn/news/337066.html

相关文章:

  • 【解决】npm run dev Syntax Error: TypeError: eslint.CLIEngine is not a constructor
  • Android 如何通过屏幕大小来适配不同大小的图片
  • 【面试题】细说mysql中的各种锁
  • TMS320F280049 EPWM模块--TZ子模块(6)
  • 数字乡村创新实践探索农业现代化路径:科技赋能农业产业升级、提升乡村治理效能与农民幸福感
  • linux中rpm包与deb包的区别及使用
  • Linux中安装seata
  • 预印本仓库ArXiv——防止论文录用前被别人剽窃
  • LNMP 架构
  • 谈谈Python中的单元测试和集成测试
  • 【2024】Prometheus通过node_exporter都监控了什么
  • Centos7配置秘钥实现集群免密登录
  • Android匿名共享内存(Ashmem)
  • MySOL之旅--------MySQL数据库基础( 3 )
  • 阿药陪你学Java(第零讲)
  • 华院计算参编《金融业人工智能平台技术要求》标准
  • vue3-element-admin二次开发遇到的问题总结,持续更新中
  • SpringMVC数据接收(全面/详细注释)
  • golang 冒泡、选择、插入、快速排序法
  • vue3 +Taro 页面实现scroll-view 分页功能
  • 【http】常见http headers
  • Web App 入门指南:构建预测模型 App 的利器(shiny)
  • 6.7物联网RK3399项目开发实录-驱动开发之Camera摄像头的使用(wulianjishu666)
  • OSCP靶场-- Sybaris
  • MyBatis 执行流程
  • android11 SystemUI入門之KeyguardPatternView解析
  • doss攻击为什么是无解的?
  • 2. 如何让mybatis-plus的逻辑删除注解@TableLogic临时失效
  • 基于单片机的智能窗帘系统设计
  • 代码随想录 Day17 字符串 | LC344 反转字符串 LC541 反转字符串II 卡码网54替换数字