当前位置: 首页 > news >正文

Windows 部署ChatGLM3大语言模型

一、环境要求

硬件

内存:>= 16GB

显存: >= 13GB(4080 16GB)

硬盘:60G

软件

python 版本推荐3.10 - 3.11

transformers 库版本推荐为 4.36.2

torch 推荐使用 2.0 及以上的版本,以获得最佳的推理性能

二、部署步骤

1、新建python3.10虚拟环境

使用pycharm建虚拟环境

2、设置镜像源

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

3、升级pip

python -m pip install --upgrade pip

4、安装项目依赖

pip install -r requirements.txt

5、安装Demo依赖

pip install -r composite_demo/requirements.txt

6、下载模型

安装git-lfs
sudo apt-get install git-lfs

git clone https://huggingface.co/THUDM/chatglm3-6b

如果从 HuggingFace 下载比较慢,也可以从 ModelScope 中下载。

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

7、运行demo

streamlit run basic_demo/web_demo_streamlit.py

http://www.lryc.cn/news/340718.html

相关文章:

  • JS相关八股之什么是事件循环
  • SpringCloud集成Skywalking链路追踪和日志收集
  • HTTP 域名和主机是一回事吗?有了主机和域名,如何建站?
  • 运营干货:四个技巧掌握爆款选题方法
  • 柯桥商务口语之怎么样说英语更加礼貌?十个礼貌用语get起来!
  • 嵌入式工程师如何摸鱼?
  • C++语言题库(一)—— 基本知识类
  • gemini1.5 API调用
  • C++从入门到精通——const与取地址重载
  • 手写spring IOC底层源码来模拟spring如何利用多级缓存解决循环依赖的问题
  • C++11 Thead线程和线程池
  • Windows版Apache 2.4.59解压直用(免安装-绿色-项目打包直接使用)
  • 刀具表面上的微结构
  • css3实现微信扫码登陆动画
  • vue3 导入excel数据
  • C# linq 根据多字段动态Group by
  • C语言学习/复习22----阶段测评编程题
  • LeetCode-1766. 互质树【树 深度优先搜索 广度优先搜索 数组 数学 数论】
  • “数据安全服务能力”评定资格认证!不容错过
  • 【MATLAB 分类算法教程】_3麻雀搜索算法优化支持向量机SVM分类 - 教程和对应MATLAB代码
  • 利用机器学习库做动态定价策略的例子
  • Tcpdump -r 解析pcap文件
  • [dvwa] sql injection(Blind)
  • linux 挂载云盘 NT只能挂载2T,使用parted挂载超过2T云盘
  • 用Skimage学习数字图像处理(021):图像特征提取之线检测(下)
  • ArduPilot飞控之Gazebo + SITL + MP的Jetson Orin环境搭建
  • 前端错误监控的方法有哪些
  • ✌粤嵌—2024/3/11—跳跃游戏
  • Docker入门实战教程
  • 数据结构初阶:二叉树(一)