当前位置: 首页 > news >正文

AI_RAG

一.为什么需要RAG(AI幻觉)

大模型LLM在某些情况下给出的回答很可能错误的,涉及虚构甚至是故意欺骗的信息。

二.什么是RAG

RAG是一种结合“信息检索”和“文本生成”的技术,旨在提升生成式AI模型的准确性和可靠性。它通过以下两个核心步骤工作:

1. 信息检索(Retrieval)

当收到用户提问时,RAG首先从外部知识库(如数据库、文档或网页)中检索与问题相关的信息片段,而不是仅依赖模型训练时学到的知识。

2..文本生成(Generation)

将检索到的相关信息和用户问题一起输入生成模型,生成更精准、基于事实的答案。

三.RAG的分块策略

按照字符数来切分

按固定字符数 结合overlapping window

按照句子来切分

递归方法 RecursiveCharacterTextSplitter

四.RAG向量和向量检索

1.Embeddings向量化

(1)向量检索

        根据用户的输入,与向量数据库中存放的文本向量进行相似度计算匹配,并检索返回最为相似的内容

(2)数据内容转为向量(目前的向量模型可实现)

2.本地大模型

        Ollama向量模型本地部署:官方网址:https://ollama.com/

3.向量间的相似度计算

常用的向量相似度计算方法包括:

        -余弦相似度Cosine:基于两个向量夹角的余弦值来衡量相似度。

        -欧式距离L2:通过计算向量之间的欧几里得距离来衡量相似度。

        -点积:计算两个向量的点积,适合归一化后的向量

4.“top-k”语义检索

        在根据向量相似度检索向量时,能够找出的相似向量一般是多个,如果我们不需要这么多或者要控制相似度的大小,top-k 语义检索就派上了用场。

五.向量数据库

http://www.lryc.cn/news/614847.html

相关文章:

  • 本地连接跳板机
  • 10. 怎么实现深拷贝?
  • ABP VNext + Apache Kafka Exactly-Once 语义:金融级消息一致性实战
  • VSCode添加Python、Java注释技巧、模板
  • 笔试——Day33
  • java web项目入门了解
  • 微信原生小程序 Timeline 组件实现
  • 在Word和WPS文字中快速拆分、合并表格
  • JavaWeb03——javascript基础语法
  • C++-AVL树
  • 微软将于 10 月停止混合 Exchange 中的共享 EWS 访问
  • SOLi-LABS Page-3 (Stacked injections) --39-53关
  • 使用 Vuepress + GitHub Pages 搭建项目文档(2)- 使用 GitHub Actions 工作流自动部署
  • 如何解决 Vue 项目启动时出现的 “No such module: http_parser” 错误问题
  • 2G内存的服务器用宝塔安装php的fileinfo拓展时总是卡死无法安装成功的解决办法
  • 企业级web应用服务器TOMCAT入门详解
  • kettle插件-kettle MinIO插件,轻松解决文件上传到MinIO服务器
  • 解决本地连接服务器ollama的错误
  • 大语言模型提示工程与应用:大语言模型对抗性提示安全防御指南
  • LLVM编译器入门
  • Java基础-TCP通信单服务器接受多客户端
  • 关于开发语言的一些效率 从堆栈角度理解一部分c java go python
  • 软考 系统架构设计师系列知识点之杂项集萃(119)
  • 数据结构(9)——排序
  • QT第三讲- 机制、宏、类库模块
  • 数字图像处理基础——opencv库(Python)
  • 算法_python_牛客华为机试笔记_01
  • 【Python 高频 API 速学 ③】
  • RecyclerView 中 ViewHolder
  • TDengine IDMP 快速体验(1. 通过云服务)