当前位置: 首页 > news >正文

【ChatGLM3-6B】Docker下快速部署

【ChatGLM2-6B】小白入门及Docker下部署

  • 前提
  • 下载安装包
    • 网盘地址
  • 开始安装
    • 加载镜像
    • 启动镜像
    • 进入容器
    • 启动模型交互页面
    • 访问页面地址

前提

  • 安装好了docker
  • 安装好了NVIDIA
  • 显卡16G

下载安装包

网盘地址

​ 这里因为网盘上传文件有大小限制,所以使用了分卷压缩的方式进行了上传,全部下载下来就可以。

链接:https://pan.baidu.com/s/1wY3QqaWrMyBR39d2ZhN_Kg?pwd=9zdd 
提取码:9zdd

在这里插入图片描述
将下载好的镜像文件和代码模型文件上传到服务器上,并进行解压,然后在该目录进行操作。

开始安装

加载镜像

docker load -i chatglm3-6b.tar

启动镜像

docker run -itd --name chatglm3 -v `pwd`/ChatGLM3:/data \
--gpus=all -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all \
-p 8501:8501 -p 8000:8000 chatglm3-6b:1.1

进入容器

docker exec -it chatglm3 bash

启动模型交互页面

cd /data 
streamlit run basic_demo/web_demo2.py

访问页面地址

http://10.22.2.18:8501/
http://www.lryc.cn/news/247257.html

相关文章:

  • 两部手机数据传输后备忘录不见了怎么回事
  • 【Unity入门】LayerMask小结
  • mysql按年、季度、月,统计
  • Python的换行和转义:深入理解代码排版与字符串处理
  • dart多线程双向通信的案例----【小学4年级课程】
  • 每日一练:简易计算器
  • Jmeter和Testlink自动化测试框架研究与实施
  • MethodArgumentNotValidException 与 ConstraintViolationException
  • 【数学】旋转矩阵
  • Python与设计模式--中介者模式
  • 后台管理系统开源项目
  • 电子印章管理系统:是什么、3个平台推荐
  • 现货黄金区间交易的两个要点
  • 安卓底部导航栏BottomNavigationView
  • rust每日一库 rand 生成随机数
  • Unity SRP 管线【第三讲:URP 光照】
  • 怎么更新BI报表数据?问我就对了
  • SpringBoot 入门学习
  • 高等数学零基础篇复习笔记
  • CentOS 系列:CentOS 7文件系统的组成
  • String转Date,Date转String
  • 大坝安全监测的内容及作用
  • Maven——Maven发展历程
  • Python与设计模式--迭代器模式
  • 【NGINX--8】HTTP/2
  • webpack项目工程初始化
  • 08-学成在线项目中统一异常处理的规范
  • 解析生效探测方法
  • 【科技素养】蓝桥杯STEMA 科技素养组模拟练习试卷11
  • 视频集中存储/磁盘阵列EasyCVR平台黑名单异常解决步骤是什么?