当前位置：首页 > article >正文

通义千问-langchain使用构建（三）

article 2025/9/17 1:07:57

目录

序言
docker 部署xinference
- 1WSL环境docker安装
- 2拉取镜像运行容器
- 3使用的界面
本地跑chatchat
- 1rag踩坑
- 2使用的界面
- - 2.1配置个前置条件然后对话
  - 2.2rag对话
结论

序言

在前两天的基础上，将xinference调整为wsl环境，docker部署。
然后langchain chatchat 还是本地虚拟环境直接跑。
以及简单在这个chatchat框架里上传了一个文本文件，询问大模型文件内容。
还行，跑起来了，坑也是不少

docker 部署xinference

1WSL环境docker安装

参考这个链接内容配置下wsl的docker环境，以及配置下国内私人dockerhub镜像源。
【现在竟然没有公司或者学校配置的dockerhub镜像了，奇怪，真奇怪。不配置就要梯子】
参考链接1:https://blog.csdn.net/wylszwr/article/details/147671490

这里有个坑，C盘如果空间不够，wsl最好迁移到D盘，因为大模型挺占空间的。

2拉取镜像运行容器

参考下面这个链接操作一下就好了，然后配置的端口，回头更新在chatchat的yaml文件就行。
【1050ti的显卡，cuda和torch这些版本适配有些麻烦，所以我就拉去的cpu版本镜像。
docker pull xprobe/xinference:latest-cpu】
参考链接2：https://inference.readthedocs.io/zh-cn/latest/getting_started/using_docker_image.html

3使用的界面

加载模型界面
就运行这里lunch模型，要等一会儿
在这里插入图片描述
这个运行这里就能看到已经下载到本地的模型了。
语言模型：就是正常对话的。
嵌入模型embedding模型：就是把上传的文本材料，解析成向量，搞到知识库的。
重排序rerank模型：目前简单理解为嵌入模型的升级版（250517）。
参考链接3：https://blog.csdn.net/2401_84033492/article/details/144546055
图像模型：简单理解为画图的。
音频模型：简单理解为听声音，转换为声音的。
视频模型：生成视频的。
在这里插入图片描述

本地跑chatchat

和上一篇的调整没啥区别。
就是yaml文件要更新。
【我看有人不建议chatchat在docker跑。我不搞是因为wsl搞docker compose插件有点繁琐】

1rag踩坑

有个问题就是上传文件半天没反应，参考这个降httpx版本就好了。
参考链接：https://blog.csdn.net/ddyzqddwb/article/details/144347702

2使用的界面

2.1配置个前置条件然后对话

在这里插入图片描述

2.2rag对话

往上找了个诗经的txt传上去，然后用模型阅读。只是一部分，全是文言文，我自己看着是挺头大的。
在这里插入图片描述
上传的文言文材料。

结论

windows机器。
wsl环境。
docker跑xinference
本地python环境跑了chatchat
实现大模型的管理加载，以及简单的知识库构建与rag管理。
这就是这次的内容。

http://www.lryc.cn/news/2378946.html

相关文章：

uniapp自动构建pages.json的vite插件

系统漏洞扫描服务：维护网络安全的关键与服务原理？

nlf loss 学习笔记

【Redis】零碎知识点（易忘 / 易错）总结回顾

基于three.js 全景图片或视频开源库Photo Sphere Viewer

LangPDF: Empowering Your PDFs with Intelligent Language Processing

OpenVLA (2) 机器人环境和环境数据

代码复现5——VLMaps

Ocean: Object-aware Anchor-free Tracking

计算机网络(1)——概述

刘家祎双剧收官见证蜕变，诠释多面人生

Axure制作可视化大屏动态滚动列表教程

MATLAB实现振幅调制（AM调制信号）

LLM-Based Agent综述及其框架学习(五)

6.1.1图的基本概念

Linux面试题集合（6）

时间筛掉了不够坚定的东西

Python集合运算：从基础到进阶全解析

jvm安全点(二)openjdk17 c++源码垃圾回收安全点信号函数处理线程阻塞

YOLOv7训练时4个类别只出2个类别

【论文阅读】针对BEV感知的攻击

18.中介者模式：思考与解读

flutter 配置安卓、Ios启动图

基于朴素贝叶斯与 LSTM 的假新闻检测模型对比分析

【LeetCode 热题 100】搜索插入位置 / 搜索旋转排序数组 / 寻找旋转排序数组中的最小值

副业小程序YUERGS，从开发到变现

计算机视觉与深度学习｜ Python实现EMD-VMD-LSTM时间序列预测（完整源码和数据)

基于LLM合成高质量情感数据，提升情感分类能力！！

网络检测工具InternetTest v8.9.1.2504 单文件版，支持一键查询IP/DNS、WIFI密码信息

SpringBoot中使用Flux实现流式返回的技术总结