当前位置: 首页 > news >正文

DB-GPT 0.7.3 版本更新:支持Qwen3 Embedding和Reranker模型、支持知识库自定义检索策略等

V0.7.3版本主要新增、增强了以下核心特性

🍀 支持Qwen3 Embedding和Reranker模型

🍀 支持知识库自定义检索策略:语义检索、全文检索、树形检索、混合检索等

🍀 新增GaussDB数据源支持

🍀 支持GLM-4.1V多模态模型

🍀 支持Apple芯片的MLX推理模型

🍀DB-GPT 支持AI/MI APIs大模型平台

🍀 新增历史会话消息导出OPEDN API

🍀 支持RAG存储客户端管理器缓存,提升框架性能

🍀 新增数据源结构化执行结果输出AWEL算子

✨新特性

1.支持Qwen3 Embedding和Reranker模型

支持本地部署Qwen3的Embedding和Reranker模型配置

配置文件示例参考:configs/dbgpt-local-qwen3.example.toml

2.支持知识库自定义检索策略:语义检索、全文检索、树形检索、混合检索等

3.DB-GPT新增GaussDB数据源

安装需要添加 --extra "datasource_postgres"

uv sync --all-packages \
--extra "base" \
--extra "proxy_openai" \
--extra "datasource_postgres" \
--extra "rag" \
--extra "storage_chromadb" \
--extra "dbgpts"

4.支持GLM-4.1V多模态模型

安装命令:

uv pip install git+https://github.com/huggingface/transformers.git

5.支持Apple芯片的MLX推理模型

使用文档:MLX Inference | DB-GPT

安装需要额外添加:--extra "mlx"

uv sync --all-packages \
--extra "base" \
--extra "hf" \
--extra "mlx" \
--extra "rag" \
--extra "storage_chromadb" \
--extra "quant_bnb" \
--extra "dbgpts"

6.DB-GPT 支持AI/MI APIs大模型平台集成

安装命令(安装OpenAI依赖即可):

AI/ML API | DB-GPT

uv sync --all-packages \
--extra "base" \
--extra "proxy_openai" \
--extra "rag" \
--extra "storage_chromadb" \
--extra "dbgpts"

7.支持RAG存储客户端管理器缓存,提升框架性能

8.新增历史会话消息导出API接口

OPEN API接口如下:

curl -L 'localhost:5670/api/v1/chat/dialogue/export_messages'

9.新增数据源结构化执行结果输出AWEL算子

添加一个新运算符来构建数据库工作流执行结果的输出,为用户提供了工作流执行结果的结构化表示,结构化输出格式如下:

{"data": [{"thoughts": "query something","sql": "sql","display_type": "response_table","data": []}]
}

🐞 Bug 修复

  • 修复自定义Prompt模板编辑后导致对话报错(#2848)

  • 提升chat_dashboard输出解析器的JSON解析健壮性(#2850)

  • 修复对话内容的换行符转义异常问题(#2854)

  • 更新GraphRAG的Milvus的truncate方法(#2847)

  • 优化Prompt按钮的页面位置(#2836)

  • 修复Client SDK的用例正确关闭客户端(#2839)

  • 优化chat_dashboard应用消息自动滚动的动画(#2797)

  • 修复Milvus判断Collection是否存在问题(#2818)

  • 修复/v2/chat/completions接口参数校验失败的异常信息(#2801)

  • 修复chat_dashboard应用的公共prompt列表数据展示问题(#2790)

  • 优化对话消息自动滚动的动画更流畅(#2792)

  • 修复单一智能体模式Agent可以多选的问题(#2785)

  • 移除chat_excel中SQL中的注释,保证SQL语法正确性(#2769)

  • 修复Reranker代理模型的问题(#2783)

  • 修复多智能体自动规划模式中,规划Agent可直接调用工具调用问题(#2778)

🛠️其他

  • 更新 OceanBase 向量数据库使用文档(#2840)

  • 更新CONTRIBUTING.md文档使用UV安装(#2855)

  • 更新文档中ChromaStore的创建方式(#2798)

✨官方文档地址

英文:http://docs.dbgpt.site/docs/overview

中文:概览 · 语雀

✨致谢

🎉新贡献者

0.7.3版本新增6位新的贡献者

  • @D1m7asis

  • @HYP-hu

  • @huhao0926

  • @jiao-duan

  • @myworking2012

  • @stevenlx96

🔥🔥感谢所有贡献者使这次发布成为可能!

@Aries-ckt, @D1m7asis, @HYP-hu, @WangzJi, @chenliang15405, @fangyinc, @geebytes, @huhao0926, @jiao-duan, @myworking2012, @stevenlx96 and @vnicers

✨附录

  • 快速开始

  • Docker 快速部署

http://www.lryc.cn/news/606765.html

相关文章:

  • 从0开始学习R语言--Day64--决策树回归
  • 登录校验一
  • zabbix平台无法删除已停用主机的处理案例
  • 【华为机试】127. 单词接龙
  • Spring Boot + MongoDB:从零开始手动配置 MongoConfig 实战
  • SAM2 : Segment Anything in Images and Videos
  • 神经网络的基础
  • 【前端】CSS Flexbox布局示例介绍
  • CSS组件化样式新篇章:@scope
  • SystemVerilog的系统函数和任务
  • 无图形界面的CentOS 7网络如何配置
  • 【0基础PS】PS工具详解--仿制图章工具
  • OpenGL Camera
  • socket编程-UDP(2)-设计翻译系统
  • 中英混合的语音识别XPhoneBERT 监督的音频到音素的编码器结合 f0 特征LID
  • 【LeetCode】算法详解#11 ---相交链表
  • 《Java 程序设计》核心知识点梳理与深入探究
  • 深入理解C语言指针:从回调函数到数组指针笔试题全解析(下)
  • Canny边缘检测算法-个人记录
  • 【世纪龙科技】3D交互深度赋能-汽车整车维护仿真教学软件
  • 汽车供应链PPAP自动化审核指南:如何用AI实现规则精准匹配与文件智能校验
  • 【世纪龙科技】汽车整车维护仿真教学软件-智构整车维护实训
  • 目标检测检出率,误检率,ap,map等评估python代码
  • 防火墙安全策略实验一
  • 分类预测 | Matlab实现CPO-PNN冠豪猪算法优化概率神经网络多特征分类预测
  • Redis学习-----Redis的基本数据类型
  • 数学与应用数学的区别是什么
  • CSS font-weight:500不生效
  • Mysql join语句
  • 智慧能源管理平台的多层协同控制架构研究