当前位置: 首页 > news >正文

Langchain-chatchat源码部署及测试实验

       一年多前接触到Langchain-chatchat的0.2版本,对0.2版本进行了本地部署和大量更新,但0.2版本对最新的大模型支持不够好,部署框架支持也不好且不太稳定,特别是多模态大模型,因此本次主要介绍0.3版本的源码部署,希望对大家有所帮助。Langchain-chatchat从0.3版本开始,支持更多的部署框架,如xinference、Ollama和FastChat,较多的是xinference框架,因此本文也是基于该框架进行模型部署。开始时参考了提供的开发指南进行部署,感觉步骤较多且麻烦,因此我就采用直接修改源码方式进行部署,作者提供的前端没有用,主要使用的是libs下面的后端接口和默认基于Streamlit提供的前端测试功能。另外,我更新完善了本地知识库加载的多种文件格式解析模块,增加了验证和路由过滤模块、返回数据格式等等,这里不详细介绍。

一、源码下载

直接去github上找Langchain-chatchat,进行下载,最后下载master线。

二、服务器环境准备

我的环境是Linux Redhat7.5,配置两种gpu显卡,合计96G
安装conda和python3.10环境
上述两步可参考相关文档,相对简单,这里不细说。

三、虚拟环境准备

conda create -n xinferenc

http://www.lryc.cn/news/442647.html

相关文章:

  • 【Linux】线程(第十六篇)
  • 2024华为杯研赛E题保姆级教程思路分析
  • 国内可以使用的ChatGPT服务【9月持续更新】
  • Linux环境Docker安装Mongodb
  • PyTorch 池化层详解
  • Intel架构的基本知识
  • Element Plus 中Input输入框
  • 大模型中常见 loss 函数
  • (十六)Ubuntu 20.04 下搭建PX4+MATLAB 仿真环境(HITL)
  • Matlab simulink建模与仿真 第十七章(补充离散库和补充数学库)
  • Android Glide:让图片加载从未如此简单
  • YOLOv9改进策略【注意力机制篇】| 2024 SCSA-CBAM 空间和通道的协同注意模块
  • Obsidian 全部笔记共享配置文件,obsidian仓库-文件夹配置统一化
  • c++可视化打印树
  • ElementUI 快速入门:使用 Vue 脚手架搭建项目
  • 算法打卡:第十一章 图论part02
  • 广度优先搜索算法及其matlab程序详解
  • 力扣 438找到字符串中所有字母异位词
  • 图像滤波---各项异性扩散滤波使用笔记及代码
  • 用Go语言构建健壮的并发系统:深入理解错误传播与处理
  • 掌握C#中的动态规划技术
  • C语言进阶【5】---数据在内存中的存储【2】(小数存储很难吗?)
  • 如何更新至CDS-Beta下载ERA5数据
  • SQL编程题复习(24/9/20)
  • react crash course 2024 (1)理论概念
  • 有关JS下隐藏的敏感信息
  • Kafka 基于SASL/SCRAM动态认证部署,kafka加账号密码登录部署
  • 富格林:积攒经验阻挠欺诈套路
  • 51单片机-红外遥控器(NEC标准)-实验(红外遥控及调速电机)
  • 云手机的便捷性和安全性体现在哪?