当前位置: 首页 > news >正文

910b上跑Chatglm3-6b进行流式输出【pytorch框架】

文章目录

    • 准备阶段
    • 避坑阶段
    • 添加代码
    • 结果展示

准备阶段

  • 配套软件包Ascend-cann-toolkit和Ascend-cann-nnae
  • 适配昇腾的Pytorch
  • 适配昇腾的Torchvision Adapter
  • 下载ChatGLM3代码
  • 下载chatglm3-6b模型,或在modelscope里下载

避坑阶段

  • 每个人的服务器都不一样,在ChatGLM3/issues中别人只需要修改指定驱动,但是我的不行
    在这里插入图片描述
  • 删除模型文件包中的model.safetensors.index.json,否则加载模型时会自动加载safetensors文件,而不加载bin文件
/home/anaconda3/envs/sakura/lib/python3.9/site-packages/torch_npu/contrib/transfer_to_npu.py:124: RuntimeWarning: torch.jit.script will be disabled by transfer_to_npu, which currently does not support it, if you need to enable torch.jit.script, please do not use transfer_to_npu.warnings.warn(msg, RuntimeWarning)
Loading checkpoint shards:   0%|                                                                                                                                     | 0/7 [00:00<?, ?it/s]
Traceback (most recent call last):File "/home/HwHiAiUser/work/ChatGLM3/basic_demo/cli_demo.py", line 22, in <module>model = AutoModel.from_pretrained(MODEL_PATH, trust_remote_code=True).npu().eval()File "/home/anaconda3/envs/sakura/lib/python3.9/site-packages/transformers/models/auto/auto_factory.py", line 558, in from_pretrainedreturn model_class.from_pretrained(File "/home/anaconda3/envs/sakura/lib/python3.9/site-packages/transformers/modeling_utils.py", line 3187, in from_pretrained) = cls._load_pretrained_model(File "/home/anaconda3/envs/sakura/lib/python3.9/site-packages/transformers/modeling_utils.py", line 3560, in _load_pretrained_modelstate_dict = load_state_dict(shard_file)File "/home/anaconda3/envs/sakura/lib/python3.9/site-packages/transformers/modeling_utils.py", line 467, in load_state_dictwith safe_open(checkpoint_file, framework="pt") as f:
FileNotFoundError: No such file or directory: "/home/HwHiAiUser/models/chatglm3-6b/model-00001-of-00007.safetensors"
/home/anaconda3/envs/sakura/lib/python3.9/tempfile.py:817: ResourceWarning: Implicitly cleaning up <TemporaryDirectory '/tmp/tmp1ygjyx3i'>_warnings.warn(warn_message, ResourceWarning)

在这里插入图片描述

添加代码

找到ChatGLM3/basic_demo/cli_demo.py
添加以下代码:

import torch
import torch_npu
import torchvision 
import torchvision_npu
from torch_npu.contrib import transfer_to_npu
import os
import platform
import time
torch_device = "npu:3" # 0~7
torch.npu.set_device(torch.device(torch_device))
torch.npu.set_compile_mode(jit_compile=False)
option = {}
option["NPU_FUZZY_COMPILE_BLACKLIST"] = "Tril"
torch.npu.set_option(option)
print("torch && torch_npu import successfully")

模型加载部分修改为:

model = AutoModel.from_pretrained(MODEL_PATH, trust_remote_code=True).npu().eval()

结果展示

在这里插入图片描述

http://www.lryc.cn/news/276692.html

相关文章:

  • 2024年江苏省职业院校技能大赛高职学生组软件测试—任务五接口测试题目
  • 螺旋数字矩阵 - 华为OD统一考试
  • 更改ERPNEXT源
  • 配置基本QinQ示例
  • 界面控件DevExpress Blazor Grid v23.2 - 支持全新的单元格编辑模式
  • 深入剖析pcap中的网络异常:TTL过期攻击、ARP中毒、TCP重传与重叠碎片等
  • 网站被挂黑链怎么办
  • WPF 导航界面悬浮两行之间的卡片 漂亮的卡片导航界面 WPF漂亮渐变颜色 WPF漂亮导航头界面 UniformGrid漂亮展现
  • [技术杂谈]使用VLC将视频转成一个可循环rtsp流
  • 手机上连网络转接app,电脑连接手机,共用网络转接app的办法
  • k8s中的容器探针
  • 4.6 BOUNDARY CHECKS
  • Java集合-LinkedList
  • 2023年阿里云云栖大会:前沿技术发布与未来展望
  • houdini microscope
  • Linux_CentOS_7.9配置时区及NTPdate同步之简易记录
  • 十九:爬虫最终篇-平安银行商城实战
  • 解决vcruntime140_1.dll无法继续执行代码的方法,一键修复dll文件丢失问题。
  • Elasticsearch:结合 ELSER 和 BM25 文本查询的相关搜索
  • 海外社媒运营为什么需要选择优质IP代理?
  • Java中的性能优化:深入剖析常见优化技巧
  • k8s的yaml文件中的kind类型都有哪些?(详述版Part2/2)
  • 什么是API网关代理?
  • AWS Simple Email Service (SES) 实战指南
  • 详解Oracle数据库的启动
  • 2024年跨境电商上半年营销日历,建议收藏
  • Go采集1688网站数据对比商品价格
  • Java泛型:灵活多变的类型参数化工具
  • java 体育明星管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目
  • 蓝凌EIS智慧协同平台 ShowUserInfo.aspx sql注入漏洞