当前位置: 首页 > news >正文

huggingface/bert/transformer的模型默认下载路径以及自定义路径

当使用 BertTokenizer.from_pretrained('bert-base-uncased') 加载预训练的 BERT 模型时,Hugging Face 的 transformers 库会从 Hugging Face Model Hub 下载所需的模型文件和分词器文件(如果它们不在本地缓存中)。

默认情况下,这些文件会被下载到本地的缓存目录中。缓存目录具体位置因您的操作系统和环境不同,但通常是以下路径之一:

默认缓存目录

  1. Linux / Unix / macOS

    • 默认路径:~/.cache/huggingface/transformers
    • 其中,~ 代表您的用户主目录。
  2. Windows

    • 默认路径:C:\Users\<YourUserName>\.cache\huggingface\transformers

自定义缓存路径

如果由于某些原因您需要更改默认的缓存路径,可以通过设置环境变量 TRANSFORMERS_CACHE 来指定新的路径。例如,在命令行中设置:

export TRANSFORMERS_CACHE=/your/custom/path

或者在 Python 代码中动态设置:

import os
os.environ['TRANSFORMERS_CACHE'] = '/your/custom/path'

检查文件的具体位置

我们可以通过简单的脚本检查缓存路径和下载的文件:

from transformers import BertTokenizer# 检查默认的缓存路径
import os
cache_path = os.path.join(os.path.expanduser("~"), ".cache", "huggingface", "transformers")
print(f"Default cache path: {cache_path}")# 加载分词器,触发下载(如果尚未下载)
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')# 列出缓存目录中的文件
for root, dirs, files in os.walk(cache_path):for file in files:print(os.path.join(root, file))

通过该脚本,可以确认默认的缓存路径,并列出缓存目录中的文件,确保模型和分词器成功下载。

http://www.lryc.cn/news/519059.html

相关文章:

  • 从 0 开始上手 Solana 智能合约
  • (六)CAN总线通讯
  • 新一代智能工控系统网络安全合规解决方案
  • Vivado中Tri_mode_ethernet_mac的时序约束、分析、调整——(一)时序约束的基本概念
  • 车载网络:现代汽车的数字心跳
  • python基础和redis
  • w~自动驾驶~合集16
  • 最长的指定瑕疵度的元音子串
  • 每日算法Day15【组合、组合总和III、电话号码的字母组合】
  • C语言教程——指针进阶(2)
  • 调和级数不为整数的证明
  • 基于微信小程序的在线学习系统springboot+论文源码调试讲解
  • 基于 Boost.Asio 和 Boost.Beast 的异步 HTTP 服务器(学习记录)
  • 有机物谱图信息的速查技巧有哪些?
  • Eureka缓存机制
  • 【LC】78. 子集
  • 协同过滤算法私人诊所系统|Java|SpringBoot|VUE|
  • Docker部署Naocs-- 超细教程
  • [java基础-集合篇]优先队列PriorityQueue结构与源码解析
  • 12. C语言 数组与指针(深入理解)
  • Postman接口测试基本操作
  • MySQL--2.1MySQL的六种日志文件
  • spring task使用
  • 【FPGA】时序约束与分析
  • LLM的MoE由什么构成:门控网络,专家网络
  • HTML-多媒体标签
  • MySQL笔记大总结20250108
  • stm32week3
  • uniapp 的uni.getRecorderManager() 录音功能小记
  • 【面试题】技术场景 4、负责项目时遇到的棘手问题及解决方法