当前位置: 首页 > news >正文

spring-ai RAG(Retrieval-Augmented Generation)

目录

    • RAG概念
    • Embedding Model & Vector Store
    • spring-ai 文本检索例子
      • 引入依赖
      • 定义向量存储: 存储两个文本说明书
      • 使用向量存储
      • 测试输出和说明
    • Spring AI 高级RAG功能实现

RAG概念

Retrieval-augmented Generation,简称RAG,检索增强生成,克服大型语言模型在处理长篇内容、事实准确性和上下文感知方面的局限性。

https://docs.spring.io/spring-ai/reference/api/retrieval-augmented-generation.html

Spring AI 通过使用增强器 API(Advisor API)为常见的检索增强生成(RAG)流程提供了现成的支持。

即RAG技术给AI装上了「实时百科大脑」,通过先查资料后回答的机制,让AI摆脱传统模型的”知识遗忘”困境。

四大核心步骤:

  1. 文档切割(语义分割,大文档分割并保证语义完整) → 建立智能档案库
  2. 向量编码(Embedding) → 构建语义地图
  3. 相似检索(VectorStore) → 智能资料猎人
  4. 生成增强(将检索增强作为上下文辅助大模型回答) → 专业报告撰写

参考:https://java2ai.com/docs/1.0.0-M6.1/tutorials/rag/?spm=5176.29160081.0.0.2856aa5cWGxNNo

Embedding Model & Vector Store

Embedding是文本、图像或视频的数值表示,能够捕捉输入之间的关系,Embedding 通过将文本、图像和视频转换为称为向量(Vector)的浮点数数组来工作。这些向量旨在捕捉文本、图像和视频的含义,Embedding 数组的长度称为向量的维度。

VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它适用于处理那些经过Embedding模型转化后的数据。在 VectorStore 中,查询与传统关系数据库不同。它们执行相似性搜索,而不是精确匹配。当给定一个向量作为查询时,VectorStore 返回与查询向量“相似”的向量。

在这里插入图片描述

spring-ai 文本检索例子

引入依赖

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-advisors-vector-store</artifactId><version>1.0.0</version>
</dependency>

定义向量存储: 存储两个文本说明书

package com.example.demo.advisor;import org.springframework.ai.document.Document;
import org.springframework.ai.embedding.EmbeddingModel;
import org.springframework.ai.vectorstore.SimpleVectorStore;
import org.springframework.ai.vectorstore.VectorStore;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;import java.util.List;@Configuration
public class RagConfig {@BeanVectorStore vectorStore(EmbeddingModel embeddingModel) {SimpleVectorStore simpleVectorStore = SimpleVectorStore.builder(embeddingModel).build();// 生成一个机器人产品说明书的文档List<Document> documents = List.of(new Document("产品说明书:产品名称:科学计算器\n" +"产品描述:科学计算器具备多种数学运算和工程计算功能,主要包含以下核心能力:\n" +"功能:\n" +"1. 数学运算:支持四则运算、三角函数(正弦、余弦、正切)、反三角函数(反正切、反余弦)、对数、指数运算等基础数学功能。部分型号如Panecal支持二进制至十六进制的数制转换。\n" +"2. 存储与编辑:配备存储器(Memory)功能,可保存计算结果并随时调用,支持公式编辑与历史记录追溯。例如Panecal允许多行公式输入和实时编辑,并可通过振动反馈减少误操作。\n" +"3. 单位换算:提供公制/英制等7类单位换算,包括长度、面积、体积、温度等类别,部分型号支持货币汇率转换。\n" +"4. 工程师专用工具:支持开发者模式,提供二进制/十六进制转换、位运算等编程相关功能。\n"),new Document("产品说明书:产品名称:智能机器人\n" +"产品描述:智能机器人是一个智能设备,能够自动完成各种任务。\n" +"功能:\n" +"1. 自动导航:机器人能够自动导航到指定位置。\n" +"2. 自动抓取:机器人能够自动抓取物品。\n" +"3. 自动放置:机器人能够自动放置物品。\n"));simpleVectorStore.add(documents);return simpleVectorStore;}
}

使用向量存储

package com.example.demo.advisor;import org.springframework.ai.chat.client.ChatClient;
import org.springframework.ai.chat.client.advisor.RetrievalAugmentationAdvisor;
import org.springframework.ai.chat.client.advisor.api.Advisor;
import org.springframework.ai.rag.generation.augmentation.ContextualQueryAugmenter;
import org.springframework.ai.rag.retrieval.search.DocumentRetriever;
import org.springframework.ai.rag.retrieval.search.VectorStoreDocumentRetriever;
import org.springframework.ai.vectorstore.VectorStore;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;@RestController
public class AdvisorController {private final ChatClient chatClient;public AdvisorController(ChatClient.Builder chatClientBuilder) {this.chatClient = chatClientBuilder.build();}@Autowiredprivate VectorStore vectorStore;/*** http://localhost:8080/ask?userInput=科学计算器有哪些功能?* http://localhost:8080/ask?userInput=智能机器人有哪些功能?*/@GetMapping("/ask")public String chat(String userInput) {// 4. 配置文档检索器DocumentRetriever retriever = VectorStoreDocumentRetriever.builder().vectorStore(vectorStore).similarityThreshold(0.5)    // 设置相似度阈值.topK(3)                     // 返回前3个最相关的文档.build();Advisor advisor = RetrievalAugmentationAdvisor.builder().queryAugmenter(ContextualQueryAugmenter.builder().allowEmptyContext(true).build()).documentRetriever(retriever).build();return chatClient.prompt().user(userInput).advisors(advisor).call().content();}}

测试输出和说明

可以看到针对用户不同的回答,回答出了不同的产品的功能
在这里插入图片描述

在这里插入图片描述

由此可以看到基于文档数据向量,我们对用户的问题进行了增强回答

Spring AI 高级RAG功能实现

参考文档:https://java2ai.com/docs/1.0.0-M6.1/tutorials/rag/?spm=5176.29160081.0.0.2856aa5cWGxNNo#%E4%B8%89spring-ai-%E9%AB%98%E7%BA%A7rag%E5%8A%9F%E8%83%BD%E5%AE%9E%E7%8E%B0

http://www.lryc.cn/news/585777.html

相关文章:

  • ESP32_启动日志分析
  • 力扣 hot100 Day41
  • RLHF:人类反馈强化学习 | 对齐AI与人类价值观的核心引擎
  • Linux711 Mysql
  • openpilot:为您的汽车插上智能驾驶的翅膀
  • 创意总监的动态视觉秘诀:用AE动态遮罩AI,轻松实现“人景分离”
  • 【每日刷题】加一
  • Java 中的锁分类
  • 【牛客刷题】吃糖果----糖果甜度问题(贪心策略详解)
  • 小车循迹功能的实现(第六天)
  • UML 与 SysML 图表对比全解析:软件工程 vs 系统工程建模语言
  • 持有对象-泛型和类型安全的容器
  • 线程通信V
  • 【Linux】系统引导修复
  • InnoDB 存储引擎的 架构
  • 渗透测试之木马后门实验
  • 世界现存燃油汽车品牌起源国别梳理
  • k8s新增jupyter服务
  • 中国国际会议会展中心模块化解决方案的技术经济分析报告
  • 【机器学习应用】基于集成学习的电力负荷预测系统实战案例
  • Linux设备树(dts/dtsi/dtb、设备树概念,设备树解析,驱动匹配)
  • kubernetes单机部署踩坑笔记
  • 【linux网络】深入理解 TCP/UDP:从基础端口号到可靠传输机制全解析
  • 【理念●体系】Windows AI 开发环境搭建实录:六层架构的逐步实现与路径治理指南
  • ATAM与效用树:架构评估的核心方法论
  • 鸿蒙 Secure Boot 全流程解析:从 BootROM 到内核签名验证的实战指南
  • 使用 lstrip() 和 rstrip() 方法
  • OpenAI 将推 AI Agent 浏览器:挑战 Chrome,重塑上网方式
  • C语言文件读写操作详解:fgetc与feof函数的应用
  • 上位机知识篇---Git符号链接