当前位置: 首页 > news >正文

轻松两步,借助向量数据库 VectorDB 与千帆 Appbuilder 构建个性化本地问答知识库

在我们日常的工作和生活中,经常会遇到需要快速获取和管理大量信息的情况。无论是解答客户的问题,还是整理公司内部的资料,一个高效的知识库系统都能帮我们省下大量时间和精力。

为了帮助大家快速构建 RAG 应用,我们之前发布了一个百度智能云:基于大模型和向量数据库的 RAG 示例的文章,意在 Step By Step 打通搭建的壁垒,但是广大的用户反馈还是比较复杂,至少需要 9 步才能搭建,这对于很多人来说确实是个不小的挑战。

为了让更多人能够轻松构建自己的知识库,我们开发了一个全新的 RAGFlow SDK。这个工具包将繁琐的流程简化为只需要 2 步,不管你有没有编程经验,都可以轻松上手,快速搭建自己的知识库系统。

在这篇文章中,我会带你一步步了解如何使用 RAGFlow SDK,只需几分钟,你就能掌握方法,并开始构建和管理你的知识库。让我们一起来体验一下这个简化后的过程吧!

1. 准备环境

1.1 VDB 向量数据库环境​​​​​​​

1. 创建百度智能云向量数据库实例,当前每个新用户都有免费试用实例,抓紧申请吧。

地址:https://console.bce.baidu.com/vdb/#/vdb/instance/create

2. 创建成功后,通过实例详情页查看访问的地址信息和账号信息,用于访问操作向量数据库。如例子截图,访问信息如下:

# 访问地址格式:http://${IP}:${PORT}
访问地址:http://192.168.20.4:5287
账号:root
密钥:xxxx

1.2 开通千帆 Embedding 模型

1. 开通千帆 Embedding 模型的收费 https://console.bce.baidu.com/qianfan/chargemanage/list

2. 创建应用,获取 API Key 和 Secret Key 。https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application

$your_qianfan_ak = API Key
$your_qianfan_sk = Secret Key

1.3 开通 AppBuilder

1. 登录 AppBuilder ,访问「密钥管理」->「新增密钥」,获取密钥信息。

$your_ab_token = 密钥

2. 开始部署

2.1 准备 SDK

本地环节下载和部署安装 RAGFlow 的 SDK。

# 下载 SDK,可以使用 wget,也可以直接浏览器访问下载地址下载到本地。
wget http://public-vdb.bj.bcebos.com/ragflow-python-sdk-1.1.zip# 解压下载的 SDK 包
unzip ragflow-python-sdk-1.1.zip# 安装 sdk 依赖的环境,等待环境安装完成
cd ragflow-python-sdk-1.1 && sudo python3 setup.py install 

2.2 启动 SDK

启动运行 RAGFlow 程序。

如果信息配置错误没关系,只需要删除 run.py 同目录下的 user_info.json 文件重新启动就行。

# 切换到 example 目录,然后启动 run.py ,首次启动根据提示输入配置信息。
# your_ab_token,AppBuilder 的密钥
# your_qianfan_ak,ModelBuilder 的 API Key
# your_qianfan_sk,ModelBuilder 的 Secret Key
# endpoint,向量数据库的访问地址,如果是 vpc 内使用,使用内网 ip,如 http://192.168.20.4:5287;如果使用外网本地访问,开通 Eip,使用 Eip 访问,参考:https://cloud.baidu.com/doc/VDB/s/wlu6oyfbu
# your_account,向量数据库的账号
# your_apikey,向量数据库的密钥
# 请输入需要向量化的文件全路径: 需要录入的知识库的 pdf 文件。
cd example && python3 example.py

3. 效果展示

启动并且配置完信息之后的效果图如下:

再次启动的效果图如下:

http://www.lryc.cn/news/382615.html

相关文章:

  • ONLYOFFICE 桌面编辑器 8.1
  • idea中的git在clone文件提示 filename too long
  • C++ 数组介绍
  • 思维导图MindManager2024最新版,让你的思维飞起来!
  • Spring容器启动流程——refresh()单个方法分析
  • Redis--注册中心集群 Cluster 集群
  • 秋招突击——6/20——复习{(单调队列优化)——最大子序列和,背包问题——宠物小精灵收服问题}——新作{两两交换链表中的节点}
  • 使用 MongoDB 剖析开放银行:技术挑战和解决方案
  • 鸿蒙 HarmonyOS NEXT星河版APP应用开发-阶段二
  • 26.4 Django 视图层
  • Hbase介绍
  • rollup学习笔记
  • 多商户零售外卖超市外卖商品系统源码
  • HTML 教程
  • 【仿真建模-解析几何】求有向线段上距指定点最近的坐标
  • Linux系统中常用的基本命令
  • 数据结构与算法:回溯算法约束条件:剪枝详解、示例(C#、C++)与回溯典型例题详解
  • 利用sortablejs实现拖拽排序
  • 超越AnimateAnyone, 华中科大中科大阿里提出Unimate,可以根据单张图片和姿势指导生成视频。
  • 【MDK5问题】:MDK5无法跳转,并且提示:no browse information available in xxxxx
  • OS中断机制-外部中断触发
  • LabVIEW如何进行电磁兼容性测试
  • Spring底层架构核心概念总结
  • hex、bin、elf、s19等文件格式介绍以及格式转换
  • oracle 窗口函数使用
  • 【Git】git常用命令
  • 【Proteus仿真】【Arduino单片机】寻迹避障蓝牙遥控小车
  • 嵌入式实验---实验八 ADC电压采集实验
  • PHP框架详解:Symfony框架的深度剖析
  • Linux `screen` 命令详解与使用指南