当前位置: 首页 > news >正文

清华GLM部署记录

环境部署

  1. 首先安装anaconda(建议包管理比较方便)windows用户需手动配置一下环境变量,下面默认是在ubuntu环境说明
  2. 创建python环境,conda create -n your_env_name python=3.10 (注:官方是提供是python3.8,但目前主流用python3.10 因此使用python3.10. your_env_name 是可以自己命名的环境名字 )
  3. 导入需要的包,这里包版本的参考,在附件中的requirements.txt, 可以使用pip install -r requirements.txt

拉取github项目

  1. git clone https://github.com/chatchat-space/langchain-ChatGLM.git

  2. cd langchain-ChatGLM

  3. 启动webui:如果是ubuntu 可以直接运行命令

    python webui.py 
    

    启动api接口:如果是ubuntu 可以直接运行命令

    python api.py
    

    多卡启动, 在命令前面指定CUDA_VISIBLE_DEVICES=0,1 类似这样 如:

    CUDA_VISIBLE_DEVICES=0,1,2,3 python api.py
    

可能遇到的问题

  • 默认直接运行命令时,第一次将会从huggingface上下载模型,可能遇到网络连接的问题,解决方案如下:

    • 重新运行,因为有断点重连,所以就不停的重新运行直到下完模型权重就行,默认地址为~/.cache/huggingface/hub/models–模型名称

    • 打开huggingface,搜索要下载的模型,在Files and versions中将模型都下载到本地,目录结构为

      .
      └── 模型文件夹
      ├── added_tokens.json
      ├── config.json
      ├── configuration_codet5p_embedding.py
      ├── merges.txt
      ├── modeling_codet5p_embedding.py
      ├── pytorch_model.bin
      ├── special_tokens_map.json
      ├── tokenizer.json
      ├── tokenizer_config.json
      └── vocab.json

      然后在langchain-ChatGLM/config/model_config.py 中配置local_model_path 字段为 模型文件夹所在的路径

更多说明

可以使用fastchat 部署做到 模型和api在不同的服务器(或相同服务器)

参考连接 https://github.com/lm-sys/FastChat/blob/main/docs/openai_api.md#restful-api-server

http://www.lryc.cn/news/182871.html

相关文章:

  • 贪心算法+练习
  • 使用华为eNSP组网试验⑷-OSPF多区域组网
  • P1843 奶牛晒衣服 【贪心】
  • 91、Redis - 事务 与 订阅-发布 相关的命令 及 演示
  • GPU如何成为AI的加速器
  • Map声明、元素访问及遍历、⼯⼚模式、实现 Set - GO语言从入门到实战
  • 机器人中的数值优化|【七】线性搜索牛顿共轭梯度法、可信域牛顿共轭梯度法
  • websocket实现go(server)与c#(client)通讯
  • 洛谷题目题解详细解答
  • 【C语言】八大排序算法
  • 2023年中国智能电视柜产量、需求量、市场规模及行业价格走势[图]
  • docker容器使用初体验
  • React Hooks ——性能优化Hooks
  • C#学习系列相关之多线程(一)----常用多线程方法总结
  • Vscode爆红Delete `␍`eslintprettier/prettier
  • Mac安装Ecplise产品报错:dose not contain the JNI_CreateJavaVM symbol
  • 如何使用大语言模型来绘制图画
  • 代码随想录算法训练营第23期day11 | 20. 有效的括号、1047. 删除字符串中的所有相邻重复项 、150. 逆波兰表达式求值
  • 数据结构-优先级队列(堆)
  • C++11新特性(语法糖,新容器)
  • 开机可用内存分析Tip
  • 【Python基础】4. 基本语句
  • 兼顾友好与安全,隐私协议 Unijoin 助推新一轮 Web3 浪潮
  • TCP端口崩溃,msg:socket(): Too many open files
  • 基于Laravel 5.6的运动健身类小程序前后端源码
  • NodeMCU ESP8266硬件开发板的熟悉
  • 计算机毕业设计 基于SSM的在线预约导游系统的设计与实现 Java实战项目 附源码+文档+视频讲解
  • Mac 挂载 Alist网盘
  • 【多模态融合】TransFusion学习笔记(1)
  • (二)正点原子STM32MP135移植——TF-A移植