当前位置: 首页 > news >正文

GraphRAG——一个基于图的检索增强生成的开源项目【送源码】

GraphRAG

最近几天,微软团队开源了GraphRAG,这是一种基于图(Graph)的检索增强生成方法。

先说说RAG吧,检索增强生成,相当于是从一个给定好的知识库中进行检索,接入LLM模型,让模型生成准确且符合上下文的答案,减少幻觉,根据特定的知识库进行符合知识库内容的回答。如果和模型微调进行比较,通俗点来说,RAG是给模型一本《答案全解》让它自己查,微调是给模型开辅导班补习。不过,传统RAG有一些待解决的问题,比如推理能力不足,答案不完整,准确性不足等。

图片

知识图谱可视化示例

而 GraphRAG 的实现流程大致如下,首先将输入文本转化为文本块,让 LLM 提取知识图谱,将知识图谱聚类,基于关键词实现子图遍历。

我们直接来看看 GraphRAG 的实战测试吧。测试基于俄乌双方关于暴力事件的上千份新闻报道,文件内容比较多,而且内容之间关系复杂,无法直接放入LLM的上下文中,RAG方法是此时的最优解。团队首先测试了第一个问题:Novorossiya 是什么?

图片

可以看到无论是 Baseline RAG 还是 GraphRAG 表现都很好,因为这种查询确实是基线RAG擅长的部分,查就完了。

但如果把问题换成:Novorossiya 做了什么?

图片

Baseline RAG 根本没法给出答案,它的源文件中没有任何东西提到这个关键词。而 GraphRAG 让 LLM 建立了知识图谱,分析实体之间的关系,生成了很不错的答案。GraphRAG 极大的提升了 RAG 的检索能力,在捕获上下文的这个过程中可以填充更多具有相关性的内容,从而让生成的答案更具准确性。

不过有一个无法避免的问题:所有的性能改进技术,都会导致 token 的使用和推理的时间增加。但这并不影响 GraphRAG 的优秀,让我们一起期待一下GraphRAG的进一步发展吧!

项目地址:

https://github.com/microsoft/graphrag

  ——EOF——

福利:

后台回复【酒店】可免费领取酒店管理系统源码

http://www.lryc.cn/news/395863.html

相关文章:

  • 什么是 VueQuill(前端的富文本编辑器)?
  • 从海上长城到数字防线:视频技术在海域边防现代化中的创新应用
  • 《信息技术与信息化 》是什么级别的期刊?是正规期刊吗?能评职称吗?
  • 【最新版】手把手Claude 3.5 Sonnet 详细步骤注册方法!
  • 代理模式和Java中的动态代理【开发实践】
  • 【Linux】进程间通信——匿名管道
  • React Native与React Native Web:跨平台开发的新选择
  • 【从零开始实现stm32无刷电机FOC】【理论】【3/6 位置、速度、电流控制】
  • 使用MySQLInstaller配置MySQL
  • 命令执行(RCE)面对各种过滤,骚姿势绕过总结
  • 复杂的数仓项目,涵盖了从数据采集、处理、存储到可视化的整个流程
  • 三相感应电机的建模仿真(3)基于ABC相坐标系Level2 S-Fun以及定子串不对称电抗起动过程仿真分析
  • 了解Adam和RMSprop优化算法
  • 对于配置LLM,集显和独显的具体区别和影响
  • uniapp上架到appstore遇到的问题
  • 每天10个vue面试题(一)
  • 【博主推荐】HTML5好看的酷酷的个人简历、个人主页、个人网站源码
  • 【深度学习】PyTorch深度学习笔记01-Overview
  • IDEA新建项目并撰写Java代码的方法
  • 24-7-9-读书笔记(九)-《爱与生的苦恼》[德]叔本华 [译]金玲
  • uniapp本地打包到Android Studio生成APK文件
  • 如何设计一个高可扩展的分布式架构?
  • 大话C语言:第28篇 内存分配与释放
  • 第一个基于FISCOBCOS的前后端项目(发行转账)
  • python采集阿里巴巴历年员工人数统计报告
  • git 基础场景操作
  • 代码随想录-DAY④-链表——leetcode 24 | 19 | 142
  • ORA-12537: TNS:连接关闭/Io 异常: Got minus one from a read call
  • 【Python】一文向您详细介绍 np.inner()
  • pdf分割,这几款软件轻松搞定PDF拆分