当前位置: 首页 > news >正文

中英双语对话大语言模型:ChatGLM-6B

介绍

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答
为了方便下游开发者针对自己的应用场景定制模型,我们同时实现了基于 P-Tuning v2 的高效参数微调方法 (使用指南) ,INT4 量化级别下最低只需 7GB 显存即可启动微调。

硬件需求

量化等级最低 GPU 显存(推理)最低 GPU 显存(高效参数微调)
FP16(无量化)13 GB14 GB
INT88 GB9 GB
INT46 GB7 GB

CPU 部署

如果你没有 GPU 硬件的话,也可以在 CPU 上进行推理,但是推理速度会更慢。使用方法如下(需要大概 32GB 内存)

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).float()

如果你的内存不足,可以直接加载量化后的模型:

# INT8 量化的模型将"THUDM/chatglm-6b-int4"改为"THUDM/chatglm-6b-int8"
model = AutoModel.from_pretrained("THUDM/chatglm-6b-int4",trust_remote_code=True).float()

截图

在这里插入图片描述

地址

ChatGLM-6B

http://www.lryc.cn/news/136466.html

相关文章:

  • MES生产报工管理
  • 五、修改官方FreeRTOS例程(STM32F1)
  • pytorch基础实践-数据与预处理
  • Java智慧工地系统源码(微服务+Java+Springcloud+Vue+MySQL)
  • PV3D: A 3D GENERATIVE MODEL FOR PORTRAITVIDEO GENERATION 【2023 ICLR】
  • Apache BeanUtils工具介绍
  • java 原子操作 笔记
  • 什么是线程安全性问题?Java中有哪些常用的同步机制来解决线程安全性问题?
  • Gitlab 安装全流程
  • pdf转word最简单方法~
  • Android 9.0 WiFi 扫描结果上报和获取流程
  • Java 项目日志实例:Log4j2
  • Effective C++条款14——在资源管理类中小心coping行为(资源管理)
  • 【网络教程】如何创建/添加钉钉机器人以及如何获取机器人的Token/Secret
  • wx原生微信小程序入门常用总结
  • 制作一个专属于安防监控业的小程序商城
  • 基于java羽毛球馆管理系统设计与实现
  • 安装elasticsearch8.9.0及修改配置
  • 如何构建高效的接口自动化测试框架?看完你就会了...
  • 53 | 金融行业股票销售指标分析
  • qiuzhiji1
  • 使用VisualStudio制作上位机(二)
  • Datawhale AI夏令营 - 用户新增预测挑战赛 | 学习笔记
  • HarmonyOS/OpenHarmony(Stage模型)卡片开发AbilityStage组件容器
  • 利用torchvision库实现目标检测与语义分割
  • 基于决策树(Decision Tree)的乳腺癌诊断
  • 前端面试的计算机网络部分(2)每天10个小知识点
  • 【LeetCode】224. 基本计算器
  • 服务器数据恢复-EVA存储磁盘故障导致存储崩溃的数据恢复案例
  • 【stylus】通过css简化搜索页面样式