当前位置: 首页 > news >正文

Hugging Face-环境配置

打开anaconda prompt

conda activate pytorch
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple transformers datasets tokenizers

pycharm

 找到pytorch下的python.exe

#将模型下载到本地调用
from transformers import AutoModelForCausalLM,AutoTokenizer#将模型和分词工具下载到本地,并指定保存路径
model_name = "uer/gpt2-chinese-cluecorpussmall"
cache_dir = "model/uer/gpt2-chinese-cluecorpussmall"#下载模型
AutoModelForCausalLM.from_pretrained(model_name, cache_dir=cache_dir)
#下载分词工具
AutoTokenizer.from_pretrained(model_name,cache_dir=cache_dir)print(f"模型分词器已下载到:{cache_dir}")

    from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline# 设置具体包含config.json的目录
    model_dir = r"D:\pycharm\sth\demo\transFormers_test\model\uer\gpt2-chinese-cluecorpussmall\models--uer--gpt2-chinese-cluecorpussmall\snapshots\c2c0249d8a2731f269414cc3b22dff021f8e07a3"# 将模型和分词工具下载到本地,并指定保存路径
    model = AutoModelForCausalLM.from_pretrained(model_dir)
    tokenizer = AutoTokenizer.from_pretrained(model_dir)# 使用模型和分词器创建生成文本的pipeline
    generator = pipeline("text-generation", model=model, tokenizer=tokenizer,device="cuda")# 生成内容
    # output = generator("你好,我是一款语言模型,",max_length=50,num_return_sequences=1)output = generator("你好,我是一款语言模型,",num_return_sequences=1, # 设置返回多少个独立的生成序列max_length=50,truncation=True,# 生成文本以适应文本最大长度temperature=0.7,# 控制文本生成的随机性,值越高,生成多样性越好top_k=50, # 限制模型在每一步生成时仅从概率最高的k个词中随机选择下一个词top_p=0.9, # 进一步限制模型生成时的词汇选择范围,选择一组概率累计达到p的词汇,模型只会从这个概率集合中采样clean_up_tokenization_spaces=True # 设置生成文本分词时的空格是否保留
    )
    print(output)
    
    from datasets import load_dataset, load_from_disk# # 在线加载
    dataset = load_dataset("lansinuote/ChnSentiCorp", cache_dir="E:/DeepLearning/data")
    # # 保存为可本地加载的格式
    save_path = "E:/DeepLearning/data/my_chn_senti_corp"
    # dataset.save_to_disk(save_path)
    # 从本地加载
    loaded_dataset = load_from_disk(save_path)
    print(loaded_dataset)test_data = dataset["test"]
    print(test_data)
    for data in test_data:print(data)
    

    http://www.lryc.cn/news/602874.html

    相关文章:

  • 洛谷 P10448 组合型枚举-普及-
  • HTML响应式SEO公司网站源码
  • 归雁思维:解锁自然规律与人类智慧的桥梁
  • 疯狂星期四文案网第22天运营日记
  • CFIHL: 水培生菜的多种叶绿素 a 荧光瞬态图像数据集
  • 递归算法的一些具体应用
  • TDSQL 技术详解
  • go‑cdc‑chunkers:用 CDC 实现智能分块 强力去重
  • Apache Ignite 的 JDBC Client Driver(JDBC 客户端驱动)
  • 利用frp实现内网穿透功能(服务器)Linux、(内网)Windows
  • OpenGL进阶系列22 - OpenGL SuperBible - bumpmapping 例子学习
  • 短剧系统开发上线全流程攻略:从架构设计到性能优化
  • 页面性能优化
  • Go性能优化深度指南:从原理到实战
  • C++-关于协程的一些思考
  • Linux 远程连接与文件传输:从基础到高级配置
  • 多系统集成前端困境:老旧工控设备与新型Web应用的兼容性突围方案
  • Docker笔记(基本命令、挂载本地gpu、Dockerfile文件配置、数据挂载、docker换源)
  • 3Dmax模型位置归零
  • [机缘参悟-237]:AI人工神经网络与人类的神经网络工作原理的相似性
  • Java项目:基于SSM框架实现的进销存管理系统【ssm+B/S架构+源码+数据库+毕业论文+远程部署】
  • Java Collections工具类
  • Mac查看本机ip地址
  • 【密码学】3. 流密码
  • 互信息:理论框架、跨学科应用与前沿进展
  • 【实时Linux实战系列】实时运动分析系统的构建
  • 表征学习:机器认知世界的核心能力与前沿突破
  • 组件化(一):重新思考“组件”:状态、视图和逻辑的“最佳”分离实践
  • 11. 若依参数验证 Validated
  • Linux DNS解析3 -- DNS解析代理配置使用