当前位置: 首页 > news >正文

【通意千问】大模型GitHub开源工程学习笔记(2)

使用Transformers来使用模型

如希望使用Qwen-chat进行推理,所需要写的只是如下所示的数行代码。请确保你使用的是最新代码,并指定正确的模型名称和路径,如Qwen/Qwen-7B-ChatQwen/Qwen-14B-Chat

这里给出了一段代码

from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfig# 可选的模型包括: "Qwen/Qwen-7B-Chat", "Qwen/Qwen-14B-Chat"
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)# 打开bf16精度,A100、H100、RTX3060、RTX3070等显卡建议启用以节省显存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True, bf16=True).eval()
# 打开fp16精度,V100、P100、T4等显卡建议启用以节省显存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True, fp16=True).eval()
# 使用CPU进行推理,需要约32GB内存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="cpu", trust_remote_code=True).eval()
# 默认使用自动模式,根据设备自动选择精度
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True).eval()# 可指定不同的生成长度、top_p等相关超参
model.generation_config = GenerationConfig.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)# 第一轮对话
response, history = model.chat(tokenizer, "你好", history=None)
print(response)
# 你好!很高兴为你提供帮助。# 第二轮对话
response, history = model.chat(tokenizer, "给我讲一个年轻人奋斗创业最终取得成功的故事。", history=history)
print(response)
# 这是一个关于一个年轻人奋斗创业最终取得成功的故事。
# 故事的主人公叫李明,他来自一个普通的家庭,父母都是普通的工人。从小,李明就立下了一个目标:要成为一名成功的企业家。
# 为了实现这个目标,李明勤奋学习,考上了大学。在大学期间
http://www.lryc.cn/news/178091.html

相关文章:

  • MQ - 35 四款MQ的架构设计与实现的对比
  • spring6-IOC容器
  • macOS - 使用 chromedriver
  • 项目进展(四)-双电机均可驱动,配置模拟SPI,调平仪功能初步实现!
  • 《学术小白学习之路13》基于DTM和主题共现网络——实现主题时序演化网络分析(数据代码在结尾)
  • 实验三十三、三端稳压器 LM7805 稳压性能的研究
  • 第三章 软件架构
  • 怎么保护苹果手机移动应用程序ipa中文件安全?
  • 中秋节快乐
  • 【记录文】Android自定义Dialog实现圆角对话框
  • 架构案例2022(四十二)
  • kafka 集群搭建 常用命令
  • 【python】numpy库
  • jvm垃圾收集算法
  • Arm机密计算架构技术(Armv9 CCA) 白皮书
  • Magisk Delta以及EdXposed工具在逍遥模拟器上安装教程
  • The Reversal Curse: LLMs trained on “A is B“ fail to learn “B is A“
  • 专栏更新情况:华为流程、产品经理、战略管理、IPD
  • 微软(TTS)文本转语音服务API实现
  • 防火墙firewalld
  • SW线光源是真实的(点光源)
  • Vue Router的安装
  • ROS架构设计
  • JSON.toJSONString() 解析之后 出现“$ref“:“$[x].xxx“
  • 2023研究生数学建模E题思路+模型+代码+论文(持续更新中) 出血性脑卒中临床智能诊疗建模
  • 云可观测性安全平台——掌动智能
  • [ruby on rails] postgres sql explain 优化
  • YOLOv7改进:GAMAttention注意力机制
  • 83、SpringBoot --- 下载和安装 MSYS2、 Redis
  • 用css画一个半圆弧(以小程序为例)