当前位置: 首页 > news >正文

【私有GPT】CHATGLM-6B部署教程

【私有GPT】CHATGLM-6B部署教程

CHATGLM-6B是什么?

ChatGLM-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的一个开源的对话机器人。根据官方介绍,这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本,约60亿参数,本地部署仅需要6GB显存。

项目地址: https://github.com/THUDM/ChatGLM-6B

我们也可以访问他的体验版

https://chatglm.cn/

image-20230819161111128

ChatGLM API申请:https://open.bigmodel.cn/

image-20230821002914324

算力云

注册地址:https://www.autodl.com/

注册可参考我的这篇文章

https://zhuanlan.zhihu.com/p/644911677

AutoDL是一个GPU租用平台,有各种型号的服务器可以选择。网络无要求,部署简单,比较稳定,价格也还好。

对电脑系统没有要求,无论是Mac电脑还是低配的windows电脑,完全云端部署,自己租服务器,浏览器打开即可。全部在云端完成,有很多服务器可以选择,可以根据自己需求租相应配置的服务器。

部署教程

项目硬件要求

image-20230819162505504

租用一台机器

租用一台机器

这个配置按照我来说是完全够用了。配置仅供参考

不知道怎么选的话,可以看这个链接 https://www.autodl.com/docs/gpu/?spm=a2c6h.12873639.article-detail.147.11146459CRKD9O

选择镜像

选择社区镜像

选择社区镜像

CHATGLM-6B

然后点击右下角的立即创建

image-20230820230750888

就会跳转到此页面,等待实例创建完成

创建实例

创建完成后

image-20230820230943510

温馨提示:实例不用后一定要记得关机!!!

就会进入此页面

image-20230820231215362

启动web服务

执行以下命令

cd ChatGLM-6B/python web_demo.py 

默认开放端口 6006

访问服务

然后回到上个页面

自定义服务

image-20230820231525244

这样就可以看见你的服务了

image-20230820231725668

使用实例

image-20230820231837775

启动api服务

由于示例只会对我们开放6006端口,所以我们需要将api服务改为6006端口访问,当然你也可以采用NGINX的方式,这里就只介绍修改端口的方式了。

vi api.py

image-20230821001523643

完成后保存

完成后保存

运行命令

python api.py

image-20230821001727098

和访问web的一样操作步骤一样,参考web服务的访问服务模块

请求示例:

curl -X POST "http://127.0.0.1:8000" \-H 'Content-Type: application/json' \-d '{"prompt": "你好", "history": []}'

当前这里的 http://127.0.0.1:8000修改为你的实例地址

例如

image-20230821002049417

启动cli服务

运行命令

 python cli_demo.py 

cli服务

使用示例:

image-20230821152713132

我是AI学习者和实践者荷逸,欢迎链接我交流AI相关知识:wx:heyi_master

http://www.lryc.cn/news/139533.html

相关文章:

  • 基于“R语言+遥感“水环境综合评价方法教程
  • To_Heart—题解——P6234 [eJOI2019] T形覆盖
  • [软件工具]精灵标注助手目标检测数据集格式转VOC或者yolo
  • Spring BeanName自动生成原理
  • 论文阅读_图形图像_U-NET
  • 基于热交换算法优化的BP神经网络(预测应用) - 附代码
  • 基于秃鹰算法优化的BP神经网络(预测应用) - 附代码
  • 2.文章复现《热电联产系统在区域综合能源系统中的定容选址研究》(附matlab程序)
  • 如何开启esxi主机的ssh远程连接
  • Android Studio实现解析HTML获取json,解析json图片URL,将URL存到list,进行瀑布流展示
  • Centos7 交叉编译QT5.9.9源码 AArch64架构
  • 爬虫逆向实战(二十)--某99网站登录
  • 【C# 基础精讲】LINQ to Objects查询
  • 【力扣】209. 长度最小的子数组 <滑动窗口>
  • 帮助中心应该用什么工具做?
  • 前端面试:【跨域与安全】跨域问题及解决方案
  • 【SQL中DDL DML DQL DCL所包含的命令】
  • LeetCode150道面试经典题-- 二叉树的最大深度(简单)
  • 【C++11】future和async等
  • Linux 系统下 GDB 调试器的使用
  • 个人首次使用UniAPP使用注意事项以及踩坑
  • VSCode 如何解决 scanf 的输入问题——Code is already running!
  • 短视频seo源码矩阵系统开源---代码php分享
  • 【docker】中文无法显示输入等问题解决方法
  • leetcode 1035. 不相交的线
  • Hystrix: 服务降级
  • 高精度运算(加减乘除乘法)
  • Mysql数据库技术知识整理
  • SpringBoot整合Mybatis 简单试用
  • SpringBoot案例-配置文件-yml配置文件