当前位置: 首页 > news >正文

下载huggingface中数据集/模型(保存到本地指定路径)

一. snapshot_download

# 1.安装huggingface_hub
# pip install huggingface_hubimport osfrom huggingface_hub import snapshot_downloadprint('downloading entire files...')
# 注意,这种方式仍然保存在cache_dir中
snapshot_download(repo_id="ibrahimhamamci/CT-RATE", repo_type="dataset",local_dir="本地路径",local_dir_use_symlinks=False, resume_download=True,token='hf_***')# 保存到特定的路径
snapshot_download(repo_id="ibrahimhamamci/CT-RATE", repo_type="dataset",cache_dir="本地路径",local_dir_use_symlinks=False, resume_download=True,token='hf_***')# download single file...,下载单个文件
# from huggingface_hub import hf_hub_download
# hf_hub_download(repo_id="ibrahimhamamci/CT-RATE", filename='config.json', 
#                 repo_type="dataset", filename='....',
#                 local_dir="/home/miao/data/dataset/CT-RATE/dataset/train",
#                 local_dir_use_symlinks=False, resume_download=True,
#                 force_download=False, subfolder='dataset/train/train_10006')

注意事项:

  • 获取token的网址
  • 下图的repo_id为“google/gemma-7b”

二.  huggingface-cli

# 1.安装huggingface-cli
# pip install -U "huggingface[cli]"
# 命令行输入:huggingface-cli -h,可以查看对应的帮助文档# 2.下载模型
# 注意,模型仍然保存在cache_dir文档中
huggingface-cli download --token hf_*** --resume-download meta-llama/Llama-2-7b-hf --local-dir Llama-2-7b-hf# 3.下载数据集
# 这种方式,数据集会保存到"/home/local-dir/"中
huggingface-cli download --repo-type dataset --token hf_** --resume-download ibrahimhamamci/CT-RATE --cache-dir /home/local-dir --local-dir-use-symlinks False

三.总结

1.若需要将数据集/模型放在指定路径,需要指定"cache-dir"参数,而不是“local-dir”

2.直接从huggingface中下载对应的模型和数据集,需要外网。因此可以使用国内镜像“HF-Mirror - Huggingface 镜像站”

四.参考

[1] HF-Mirror - Huggingface 镜像站

http://www.lryc.cn/news/328654.html

相关文章:

  • HarmonyOS实战开发-使用List组件实现导航与内容联动的效果。
  • ArcGIS二次开发(一)——搭建开发环境以及第一个简单的ArcGIS Engine 程序
  • Oracle 19c 高可用部署实战系列之Data Guard理论与实战
  • ubuntu常用记录
  • 顺序表专题
  • 手写SpringBoot(三)之自动配置
  • vitepress builld报错
  • redis分布式锁-----基于Redis的SETNX命令的简单分布式锁实现
  • HTTP请求头中的Host表示是什么?
  • apk被play protect blocked的解决方案(ADB+Appium+webdriverio)
  • 【BlossomRPC】手把手教你写一个RPC协议
  • 算法之美:堆排序原理剖析及应用案例分解实现
  • Net8 ABP VNext完美集成FreeSql、SqlSugar,实现聚合根增删改查,完全去掉EFCore
  • yolov8直接调用zed相机实现三维测距(python)
  • element跑马灯/轮播图,第一页隐藏左边按钮,最后一页隐藏右边按钮(vue 开箱即用)
  • 下载及安装PHP,composer,phpstudy,thinkPHP6.0框架
  • volatile使用场景总结
  • AcWing 1413. 矩形牛棚(每日一题)
  • macOS Sonoma 14.4.1 (23E224) 正式版发布,ISO、IPSW、PKG 下载
  • WPF使用外部字体,思源黑体,为例子
  • 9、jenkins微服务持续集成(一)
  • VOC(客户之声)赋能智能家居:打造个性化、交互式的未来生活体验
  • 时序预测 | Matlab实现GWO-BP灰狼算法优化BP神经网络时间序列预测
  • node.js学习(2)
  • 【pytest】测试数据存储在 Excel 或 TXT 文件中,如何参数化
  • ubuntu22.04@Jetson Orin Nano安装配置VNC服务端
  • 面向对象特征二:继承
  • 宝塔面板CentOS Stream 8 x86 下如何安装openlitespeed
  • LeetCode 2952.需要添加的硬币的最小数量:贪心(排序)
  • 基于SpringBoot + Vue实现的在线装修管理系统设计与实现+毕业论文