当前位置：首页 > news >正文

AI_RAG

news 2025/8/10 5:24:48

一.为什么需要RAG（AI幻觉）

大模型LLM在某些情况下给出的回答很可能错误的，涉及虚构甚至是故意欺骗的信息。

二.什么是RAG

RAG是一种结合“信息检索”和“文本生成”的技术，旨在提升生成式AI模型的准确性和可靠性。它通过以下两个核心步骤工作：

1. 信息检索（Retrieval）

当收到用户提问时，RAG首先从外部知识库（如数据库、文档或网页）中检索与问题相关的信息片段，而不是仅依赖模型训练时学到的知识。

2..文本生成（Generation）

将检索到的相关信息和用户问题一起输入生成模型，生成更精准、基于事实的答案。

三.RAG的分块策略

•按照字符数来切分

•按固定字符数结合overlapping window

•按照句子来切分

•递归方法 RecursiveCharacterTextSplitter

四.RAG向量和向量检索

1.Embeddings向量化

（1）向量检索

根据用户的输入，与向量数据库中存放的文本向量进行相似度计算匹配，并检索返回最为相似的内容

（2）数据内容转为向量（目前的向量模型可实现）

2.本地大模型

Ollama向量模型本地部署：官方网址：https://ollama.com/

3.向量间的相似度计算

常用的向量相似度计算方法包括：

-余弦相似度Cosine：基于两个向量夹角的余弦值来衡量相似度。

-欧式距离L2：通过计算向量之间的欧几里得距离来衡量相似度。

-点积：计算两个向量的点积，适合归一化后的向量

4.“top-k”语义检索

在根据向量相似度检索向量时，能够找出的相似向量一般是多个，如果我们不需要这么多或者要控制相似度的大小，top-k 语义检索就派上了用场。

五.向量数据库

查看全文

http://www.lryc.cn/news/614847.html

本地连接跳板机

10. 怎么实现深拷贝？

ABP VNext + Apache Kafka Exactly-Once 语义：金融级消息一致性实战

VSCode添加Python、Java注释技巧、模板

笔试——Day33

java web项目入门了解

微信原生小程序 Timeline 组件实现

在Word和WPS文字中快速拆分、合并表格

JavaWeb03——javascript基础语法

C++-AVL树

微软将于 10 月停止混合 Exchange 中的共享 EWS 访问

SOLi-LABS Page-3 (Stacked injections) --39-53关

使用 Vuepress + GitHub Pages 搭建项目文档（2）- 使用 GitHub Actions 工作流自动部署

如何解决 Vue 项目启动时出现的 “No such module: http_parser” 错误问题

2G内存的服务器用宝塔安装php的fileinfo拓展时总是卡死无法安装成功的解决办法

企业级web应用服务器TOMCAT入门详解

kettle插件-kettle MinIO插件，轻松解决文件上传到MinIO服务器

解决本地连接服务器ollama的错误

大语言模型提示工程与应用：大语言模型对抗性提示安全防御指南

LLVM编译器入门

Java基础-TCP通信单服务器接受多客户端

关于开发语言的一些效率从堆栈角度理解一部分c java go python

软考系统架构设计师系列知识点之杂项集萃（119）

数据结构（9）——排序

QT第三讲- 机制、宏、类库模块

数字图像处理基础——opencv库（Python）

算法_python_牛客华为机试笔记_01

【Python 高频 API 速学 ③】

RecyclerView 中 ViewHolder

TDengine IDMP 快速体验（1. 通过云服务）