当前位置: 首页 > news >正文

聊一聊知识图谱结合RAG

        因为最近在做一些关于提高公司内部使用的聊天机器人的回答准确率,并且最近微软官方也是开源了一下graphrag的源码,所以想聊一聊这个知识图谱结合rag。

        rag在利用私有数据增强大模型回答的领域是一种比较典型的技术,也就是我们提出问题的时候,rag会根据我们的问题去知识库中检索一些比较相关的文档或者语句,将这些文档和我们的问题一起拼接到提示词模版中,得到一个完整的提问大模型的问题,这样大模型就可以根据我们提供的知识以及我们的问题来对特定领域的问题进行回答了。

        首先,我们了解一下传统的rag技术,传统的rag技术就是通过匹配文档语句的相关性或者相似度来得到一些比较相关的文档。可以分为两个角色,分别是用户和文档管理者。大致流程:

        文档管理者:

        ①上传导入文件,解析文件内容

        ②对文本内容进行切块,每一块可以成为一个chunk。

        ③得到每个chunk,利用嵌入式模型得到每个chunk的向量表示,并将这个向量存储到向量数据库中,常见的向量数据库,比如faiss数据库,将其作为一个本地知识库。

        用户:

        ①提出问题

        ②对问题进行向量化

        ③利用得到的向量去知识库中匹配,得到相关性分数比较大的一些语句块,即chunk,这里就会涉及到一些检索技术了

        ④得到chunk,将其和问题拼接到提示词模版中,就可以得到一个完整的对大模型的问题。

        ⑤大模型回答问题,得到答案

        由此,我们可以看的出来,传统的rag是一种局部检索的技术,也就是我们提问的问题会跟每个语句块进行匹配得到相关性分数,只能提问一些局部的问题,以及得到一种比较局部的答案,当我们要问某个文档的全局性的问题的时候,他就不会出现很好的效果。

        这时候就需要知识图谱了,知识图谱是一种类似于图结构,其中有很多的实体,也就是结点,也有很多的关系,也就是边,一个文档可以理解为一个图结构,各个文档之间没有交集,也就是对应的图结构不会有关系。

        这样,我们在上传文档的时候,切分为了很多的块,即chunk,我们会将每个块交给大模型,让其提取其中的实体和关系,然后存储起来,实体和关系分别存储到各自的集合中,最终所有的chunk提取完以后,一次性的将所有的结点和关系存储到一个图数据库中,然后我们就可以在数据库中得到这个文档的一个知识图谱。这样,当用户提问的时候,就可以提供更丰富的上下文或者关系,提供总结能力和回答的准确性。

http://www.lryc.cn/news/408037.html

相关文章:

  • Java面试锦集 之 一、Java基础(1)
  • 【leetcode】排列序列
  • 【Cesium开发实战】视频融合功能的实现,可自定义位置和视频路径
  • 【秋招笔试题】小明的美食
  • 基于OpenLCA、GREET、R语言的生命周期评价方法、模型构建及典型案例应用
  • Linux操作系统 -socket网络通信
  • 【苍穹】完美解决由于nginx更换端口号导致无法使用Websocket
  • Qt中在pro中实现一些宏定义
  • bash XXX.sh文件和直接运行XXX.sh的区别
  • 【Python机器学习】k-近邻算法简单实践——改进约会网站的配对效果
  • vue3前端开发-小兔鲜项目-登录组件的开发表单验证
  • Winform上位机TCP客户端/服务端、串口通信
  • Linux基础复习(二)
  • nginx漏洞修复 ngx_http_mp4_module漏洞(CVE-2022-41742)【低可信】 nginx版本升级
  • 网格布局 HTML CSS grid layout demo
  • Java算法之递归算法-如何计算阶乘的值
  • python爬虫入门小案例
  • 【昇腾AI创新大赛集训营南京站学习笔记】-Ascend算子开发课程
  • 系统架构设计师教程 第4章 信息安全技术基础知识-4.5 密钥管理技术4.6 访问控制及数字签名技术-解读
  • C语言日常练习Day13
  • map、foreach、filter这些方法你还不知道什么时候该用哪个吗?那就看过来
  • 6.3 面向对象技术-设计模式
  • Mac 中安装内网穿透工具ngrok
  • python count返回什么
  • mac清理软件哪个好用免费 MacBook电脑清理软件推荐 怎么清理mac
  • 学生党百元蓝牙耳机哪个性价比高?精选四款超强性价比耳机型号
  • 中文之美,美在辞藻富丽,也美在情感含蓄内敛。
  • FPGA与ASIC:深入解析芯片设计的双子星
  • 深入 Symfony 服务容器:依赖注入的艺术
  • 基于Java+SpringMvc+Vue技术的慈善捐赠平台设计与实现(源码+LW+部署讲解)