当前位置: 首页 > news >正文

什么是检索增强生成(RAG)?

什么是检索增强生成(RAG)?

检索增强生成(Retrieval-Augmented Generation,简称RAG),从名字就能看出,这是一种专为信息检索设计的技术。它的思路非常直接:假设你有大量文档,想要从中搜索并提取信息——就像向一个“知道答案的人”提问,或者是,向一个“已经研读了你提供的所有材料的人”提问。当被询问时,这个人不仅能指出信息在材料中的位置,还能组织出恰当的文字回答。

在RAG技术中,这个“人”就是大语言模型(LLM),那些“研读材料”被称为上下文(context),而最终的文字回答则是基于从“增强知识”(即那些研读材料或上下文)中检索(R) 到的信息生成(G)的输出。当然,回答的质量取决于材料的质量和数量:上下文需要包含相关信息,但不能掺杂过多无关内容。和人类一样,模型往往会更关注开头和结尾的信息;随着上下文长度增加,模型准确定位所需信息的难度也会越来越大。

因此,RAG流程中一个非常重要的步骤是:筛选出最可能包含答案的文档并整合成上下文,而不是把所有材料都给模型。

RAG是一种灵活性很强的技术,它的效果依赖于通用大语言模型的能力。再用刚才的类比:LLM就像一个受过良好教育的人,只要你让它研读某个主题的材料,它就能回答相关问题。任何时候,你都可以给它换一批不同主题的内容,或者更新版本的材料,再让它回答新的问题。这里的关键是:这个人受教育程度越高,无论面对什么主题,给出的答案质量就越好。对应到语言模型上,这意味着在预算允许的情况下,选择尽可能大的通用模型通常效果更好——对于RAG来说,我们需要的是一个“多面手”。

如果说RAG是“通才的技术”,那么微调就是“专才

http://www.lryc.cn/news/596317.html

相关文章:

  • 引擎动画系统设计
  • 【PTA数据结构 | C语言版】不相交集基本操作
  • Visual Studio Code 远端云服务器开发使用指南
  • 服务器连接Hugging Face
  • 【机器学习深度学习】微调量化与模型导出量化:区分与应用
  • HttpSecurity详解
  • 生存分析机器学习问题
  • Oracle定时清理归档日志
  • 通过 Docker 部署测试 CODESYS PLC示例
  • Linux_Ext系列文件系统基本认识(一)
  • 【实战】Dify从0到100进阶--文档解读(11)其他节点
  • 使用空间数据训练机器学习模型的实用工作流程
  • 时序数据库IoTDB好不好?
  • 使用ZYNQ芯片和LVGL框架实现用户高刷新UI设计系列教程(第二十二讲)
  • 【LINUX】CentOS Stream 9 手动配置网络
  • CentOS 8文件描述符耗尽检测与处理实战指南
  • JMeter 实现 Protobuf 加密解密
  • vue2.0 + elementui + i18n:实现多语言功能
  • SpringBoot集成PDFBox实现PDF导出(表格导出、分页页码、电子签章与数字签名)
  • Excel file format cannot be determined, you must specify an engine manually.
  • SparkSQL 聚合函数 COUNT 对 NULL 值的处理
  • MDC(Mapped Diagnostic Context) 的核心介绍与使用教程
  • CMake项目中的main函数重复定义错误
  • 拆分、合并PDF
  • 实现分布式锁
  • 数据库表介绍
  • 金仓数据库风云
  • Docker 安装、常用命令、应用部署
  • 3516cv610 mqtt库移植
  • 【工作常用】C++/QT插件编程思想——即插即用