当前位置: 首页 > news >正文

colab中数据集保存到drive与取出的方法

from google.colab import drive
drive.mount('/content/drive')

一、下载数据集

from datasets import load_dataset
max_length = 32  # Maximum length of the captions in tokens
coco_dataset_ratio = 50  # 50% of the COCO2014 dataset# Load the COCO2014 dataset for training, validation, and testing splits
train_ds = load_dataset("HuggingFaceM4/COCO", split=f"train[:{coco_dataset_ratio}%]")
valid_ds = load_dataset("HuggingFaceM4/COCO", split=f"validation[:{coco_dataset_ratio}%]")
test_ds = load_dataset("HuggingFaceM4/COCO", split="test")

二、保存数据集

dataset_path = '/content/drive/My Drive/COCO_Dataset_all'
train_ds.save_to_disk(dataset_path + '/train')
valid_ds.save_to_disk(dataset_path + '/validation')
test_ds.save_to_disk(dataset_path + '/test')

三、取出数据集

dataset_path = '/content/drive/My Drive/COCO_Dataset'
from datasets import load_from_disktrain_ds = load_from_disk(dataset_path + '/train')
valid_ds = load_from_disk(dataset_path + '/validation')
test_ds = load_from_disk(dataset_path + '/test')

http://www.lryc.cn/news/321532.html

相关文章:

  • React 应该如何学习?
  • 跨平台无缝操作:ShareMouse让多电脑协同更高效
  • Vue使用pandoc-wasm进行各格式转换
  • springboot284基于HTML5的问卷调查系统的设计与实现
  • AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
  • 详谈分布式事务
  • Java基础知识八股
  • 【Linux】网络基础一
  • Redis-2 Redis基础数据类型与基本使用
  • python提取身份证中的生日和性别
  • opencv 傅里叶变换(低通滤波 + 高通滤波)
  • Educational Codeforces Round 163 (Rated for Div. 2)(A,B,C,D,E)
  • 索引常见面试题
  • 【Unity】旋转的尽头是使用四元数让物体旋转
  • 哔哩哔哩秋招Java二面
  • OSPF特殊区域(stub\nssa)
  • 全球首位AI程序员诞生,将会对程序员的影响有多大?
  • 【晴问算法】提高篇—动态规划专题—最长上升子序列
  • 天软特色因子看板(2024.3第5期)
  • 静态网络配置
  • 多种智能搜索算法可视化还原 3D 魔方
  • Maven,pom.xml,查找 子jar包
  • MySQL中数据库表的监控
  • 【S5PV210_视频编解码项目】裸机开发2:实现PWM波形驱动蜂鸣器
  • js进阶-深入对象-内置构造函数-包装类
  • Linux作业
  • 信息发布系统
  • Dell Inspiron 戴尔灵越16plus7620升级M2硬盘
  • 视频怎么转mp4格式?分享3个宝藏方法,轻松学会
  • Javascript 元二分搜索 | 单边二分查找(Meta Binary Search | One-Sided Binary Search)