当前位置: 首页 > news >正文

RAGFLOW~Enable RAPTOR

Enable RAPTOR

        一种递归抽象方法,用于长上下文知识检索和摘要,在广泛语义理解和细微细节之间取得平衡。

        RAPTOR(递归抽象处理用于树状组织检索)是一种在2024年论文中引入的增强文档预处理技术。它旨在解决多跳问答问题,通过递归聚类和对文档片段进行摘要化来构建层次树结构。这使得在长文档中的上下文感知检索更加有效。RAGFlow v0.6.0在数据提取和索引之间的数据预处理管道中集成了RAPTOR用于文档聚类,如下图所示。

        我们使用这种新方法进行的测试在需要复杂多步骤推理的问题回答任务中展示了最先进的(SOTA)结果。通过结合RAPTOR检索与我们内置的分块方法和其他检索增强生成(RAG)方法,您可以进一步提高问题回答的准确性。

        警告:启用RAPER需要大量的内存、计算资源和tokens。

Basic principles

        在原始文档被分割成块之后,这些块根据语义相似性进行聚类,而不是按照它们在文本中的原始顺序。然后,通过系统的默认聊天模型将这些簇总结为更高层次的块。这个过程递归地应用,形成一个从下到上具有不同层次摘要的树结构。如图所示,初始块形成叶节点(显示为蓝色),并递归地总结为根节点(显示为橙色)。

        

        递归聚类和总结能够捕捉到广泛的理解(由根节点实现)以及多跳问答所需的细微细节(由叶节点实现)。

Scenarios

        对于涉及复杂多步骤推理的多跳问答任务,问题和答案之间通常存在语义差距。因此,使用问题进行搜索往往无法检索到有助于正确答案的相关片段。RAPTOR通过为聊天模型提供更丰富、更具上下文关联性和相关性的片段来解决这一挑战,使其能够全面理解而不丢失细节。

        知识图谱也可以用于多跳问答任务。详见构建知识图谱的详细信息。你可以使用任一方法或两者结合,但要确保理解涉及的内存、计算和标记成本。

Prerequisites

        系统的默认聊天模型用于总结聚类内容。在继续之前,请确保已正确配置聊天模型。

Configurations​

        RAPTOR功能默认是禁用的。要启用它,请手动在知识库的配置页面上打开“使用RAPTOR增强检索”开关。

Prompt

        以下提示将递归应用于聚类摘要,{cluster_content}作为内部参数。我们建议您现在保持不变。设计将在适当时候更新。

Please summarize the following paragraphs... Paragraphs as following:{cluster_content}
The above is the content you need to summarize.

​Max token​

        每个生成摘要块的最大标记数。默认为256,最大限制为2048。

Threshold

        在RAPTOR中,块根据其语义相似性进行聚类。阈值参数设置块被分组在一起所需的最小相似度。默认值为0.1,最大限制为1。较高的阈值意味着每个簇中的块较少,较低的阈值则意味着更多。

Max cluster

        创建的最大聚类数量。默认为64,最大限制为1024。

Random seed

        一个随机种子。点击+以更改种子值。

相关资料:

      1、 Enable RAPTOR | RAGFlow

      2、  https://huggingface.co/papers/2401.18059

http://www.lryc.cn/news/607099.html

相关文章:

  • 机器学习sklearn:随机森林的决策树
  • OPENGLPG第九版学习 - 纹理与帧缓存 part2
  • 数据结构学习基础和从包装类缓存到泛型擦除的避坑指南
  • C++入门基础 2
  • C语言使用GmSSL库实现sm3、sm4算法
  • Linux----信号
  • Docker学习其二(容器卷,Docker网络,Compose)
  • cocosCreator2.4 googlePlay登录升级、API 35、16KB内存页面的支持
  • 特征工程 --- 特征提取
  • (一)LoRA微调BERT:为何在单分类任务中表现优异,而在多分类任务中效果不佳?
  • 【C++】类和对象 上
  • 逻辑回归算法中的一些问题
  • Leetcode——53. 最大子数组和
  • elementui中rules的validator 用法
  • 在线教程丨全球首个 MoE 视频生成模型!阿里 Wan2.2 开源,消费级显卡也能跑出电影级 AI 视频
  • Windows11 WSL安装Ubntu22.04,交叉编译C语言应用程序
  • 网站建设服务器从入门到上手
  • 《n8n基础教学》第一节:如何使用编辑器UI界面
  • 如何优雅删除Docker镜像和容器(保姆级别)
  • 服务器地域选择指南:深度分析北京/上海/广州节点对网站速度的影响
  • FreeSWITCH与Java交互实战:从EslEvent解析到Spring Boot生态整合的全指南
  • 分布式弹幕系统设计
  • Git 误删分支怎么恢复
  • ABP VNext + Dapr Workflows:轻量级分布式工作流
  • stl的MATLAB读取与显示
  • Blender 4.5 安装指南:快速配置中文版,适用于Win/mac/Linux系统
  • 【Mysql】字段隐式转换对where条件和join关联条件的影响
  • 安全专家发现利用多层跳转技术窃取Microsoft 365登录凭证的新型钓鱼攻击
  • 基于Pipeline架构的光存储读取程序 Qt版本
  • 九、Maven入门学习记录