当前位置: 首页 > news >正文

KG-CoT:基于知识图谱的大语言模型问答的思维链提示

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

一些符号定义

知识图谱实体数量: n n n
知识图谱中关系类型数量: m m m
三元组矩阵: M ∈ { 0 , 1 } n × n × m \textbf{M} \in \{0, 1\}^{n \times n \times m} M{0,1}n×n×m M i j k = 1 M_{ij}^k = 1 Mijk=1则说明实体 i i i和实体 j j j之间具有关系 k k k
输入问题 q q q:输入的问题
初始实体表示向量 e 0 ∈ { 0 , 1 } n \textbf{e}^0 \in \{0,1\}^n e0{0,1}n,如果输入问题q中存在实体i,则 e i 0 = 1 e^0_i = 1 ei0=1

分步 图推理模型:Step-by-Step Graph Reasoning Model

第一步:关系评分计算(Relation Score Calculation):计算每一步推理的关系得分
在这里插入图片描述
在这里插入图片描述

E n c o d e r Encoder Encoder:文本编码器,例如bert,利用它得到整段文本的表示 q \textbf{q} q和所有字符的表示 h 1 , . . . , h ∣ q ∣ h_1, ..., h_{|q|} h1,...,hq
f t f^{t} ft:推理第 t t t步的编码器(MLP+tanh映射)
q t \textbf{q}^t qt:推理第 t t t步的文本表示
R t \textbf{R}^t Rt:推理第 t t t步的关系评分

第二步:分步推理(Step-by-Step Reasoning):计算每个实体的评分

根据关系评分为实体之间的权重赋值
W i j t = { R k t M i j k = 1 0 Otherwise, W_{ij}^t = \begin{cases} R_k^t & M_{ij}^k = 1 \\ 0 & \text{Otherwise,} \end{cases} Wijt={Rkt0Mijk=1Otherwise,

根据每一步的实体间权重,从初始实体 e 0 \textbf{e}^0 e0开始,得到每一步推理的实体权重,最后通过注意力机制汇总所有的推理步,得到所有实体的评分 e ˉ \bar{\mathbf{e}} eˉ

e t = e t − 1 W t β = Softmax ( MLP ( q ) ) , e ˉ = ∑ t = 1 T β t e t , \mathbf{e}^t = \mathbf{e}^{t-1} \mathbf{W}^t \\ \beta = \text{Softmax}(\text{MLP}(\mathbf{q})), \\ \bar{\mathbf{e}} = \sum_{t=1}^T \beta_t \mathbf{e}^t, et=et1Wtβ=Softmax(MLP(q)),eˉ=t=1Tβtet,

第三步:训练
L = ∥ e ˉ − a ∥ 2 . \mathcal{L} = \|\bar{\textbf{e}} - \textbf{a}\|^2. L=eˉa2.
其中 a \textbf{a} a为候选答案实体。

推理路径生成算法:Reasoning Path Generation Method

步骤1:从知识图谱实体集合中抽取评分( e ˉ \bar{\mathbf{e}} eˉ)前TopK大(之后有不同K取值的对比实验)的实体集合 E k \textbf{E}^k Ek
步骤2:从问题q中的实体开始,向外拓展抽取一跳/两跳路径,需要满足 W i j 1 , W i j 1 W_{ij}^1,W_{ij}^1 Wij1,Wij1均大于0,并且推理结束实体在 E k \textbf{E}^k Ek集合中。
p i j 1 = ⟨ E i , R e l i j , E j , [ W i j 1 ] ⟩ p i k 2 = ⟨ E i , R e l i j , E j , R e l j k , E k , [ W i j 1 , W i j 2 ] ⟩ p_{ij}^1 = \langle E_i, Rel_{ij}, E_j , [W_{ij}^1] \rangle \\ p_{ik}^2 = \langle E_i, Rel_{ij}, E_j, Rel_{jk}, E_k , [W_{ij}^1,W_{ij}^2] \rangle pij1=Ei,Relij,Ej,[Wij1]⟩pik2=Ei,Relij,Ej,Reljk,Ek,[Wij1,Wij2]⟩
步骤3:计算路径的平均W分数作为路径分数,对每个结束实体,挑选路径分数前N大(之后有不同N取值的对比实验)的路径作为大模型的提示模版。

联合推理:Joint Reasoning

将推理路径生成算法得到的推理路径转为文本模版,加入大模型提示中,回答问题。
在这里插入图片描述
在这里插入图片描述

实验

数据集

WebQSP:WebQSP是一个知识密集型的多跳问题回答基准测试。它包含4037个问题,都是基于FreeBase的1跳或2跳问题。基于之前的工作,在问题实体的2跳邻域内检索知识三联体,并生成一个包含1886684个实体、1144个关系和5780246个知识三联体的知识子图。

CompWebQ:CompWebQ是一个多跳的问题回答基准。它包含34,672个问题,有许多跳跃和约束,这使得llm的处理具有挑战性。他们利用[Shi et al.,2021]中检索到的知识子图,并利用原始数据分割进行评估。

Simple Questions:Simple Questions是一个单跳的问题回答基准。问题是基于来自FreeBase的信息而产生的,最终,在本研究中产生了108,442个严重依赖于事实知识的问题。他们随机选择1000个问题,检索问题实体的1跳邻域进行评估。

WebQuestions:WebQuestions是一个具有挑战性的自主领域的问题回答基准。它包含5,810个问题,以自由库作为知识库。对于每个问题,我们检索问题实体的2跳邻域,并利用原始数据分割进行评估。

实验结果

在这里插入图片描述

研究不同基座模型对实验效果的影响

在这里插入图片描述

对比不同检索器

在这里插入图片描述

研究超参数K和超参数N对实验结果的影响

在这里插入图片描述

示例

在这里插入图片描述

优势:计算更快,节省大模型资源

在这里插入图片描述

创新点

提出了一套可训练子图抽取算法,能够结合根据问题得到需要查询关系类型,进而生成许多推理路径。

可能的改进点

在这里插入图片描述

  1. 得到问题 第t步 表示的时候,我认为也需要考虑前t-1步推理路径加入到运算中。

  2. 该方法适用场景受限,由于第一阶段只是对关系类型进行打分,然后将关系分数分配给实体。如果图谱中关系类型很少,三元组数目很多,那么在第二阶段挑选TopK实体的时候,可能会面临很多实体同分的状况,无法挑选合适的实体。除此以外,从问题中可能抽取多个不同的实体,如果分配相同的下一跳关系权重的话,也是不合适的。

http://www.lryc.cn/news/519732.html

相关文章:

  • 【JMeter】多接口关联
  • 2020 年 12 月青少年软编等考 C 语言五级真题解析
  • 前端实时显示当前在线人数的实现
  • Linux第一个系统程序---进度条
  • vscode 无法使用npm, cmd命令行窗口可以正常执行
  • Leetcode 967 Numbers With Same Consecutive Differences
  • node.js中实现token的生成与验证
  • [C++11]_[初级]_[工作线程如何监听主线程条件变量wait_for方法的使用]
  • Openstack持久存储-Swift,Cinder,Manila三者之间的区别
  • 深度学习第三弹:python入门与线性表示代码
  • 解决报错记录:TypeError: vars() argument must have __dict__ attribute
  • SpringBoot 原理篇(day14)
  • Vscode辅助编码AI神器continue插件
  • Type-C单口便携显示器-LDR6021
  • 青少年编程与数学 02-006 前端开发框架VUE 19课题、内置组件
  • 腾讯云AI代码助手编程挑战赛 - 使用 JavaScript 构建一个简易日历
  • Xcode 正则表达式实现查找替换
  • 学习flv.js
  • FreePBX 17 on ubuntu24 with Asterisk 20
  • 【算法】算法大纲
  • 【MySQL】SQL菜鸟教程(一)
  • 安装本地测试安装apache-doris
  • 【Apache Paimon】-- 13 -- 利用 paimon-flink-action 同步 mysql 表数据
  • IOS HTTPS代理抓包工具使用教程
  • 在 Ubuntu 22.04 上从 Wayland 切换到 X11的详细步骤
  • 【Linux】4.Linux常见指令以及权限理解(2)
  • ffmpeg aac s16 encode_audio.c
  • vue3监听器
  • 03-51单片机定时器和串口通信
  • 系统架构设计师考点—项目管理