当前位置: 首页 > news >正文

可信和可解释的大语言模型推理-RoG

大型语言模型(LLM)在复杂任务中表现出令人印象深刻的推理能力。然而,LLM在推理过程中缺乏最新的知识和经验,这可能导致不正确的推理过程,降低他们的表现和可信度。知识图谱(Knowledge graphs, KGs)以结构化的形式存储了大量的事实,为推理提供了可靠的知识来源。然而,现有的基于KG的LLM推理方法只将KG作为事实知识库,忽略了其结构信息对推理的重要性。本文提出了一种称为图谱推理(RoG)的新方法,该方法将LLM与KGs协同使用,以实现可信和可解释的推理。
在这里插入图片描述

1 三个步骤

推理图(Reasoning on Graphs, RoG)提出了一个计划-检索-推理框架,该框架的核心流程包括以下几个步骤:

规划生成(Planning Generation):给定一个问题,首先使用大型语言模型(LLM)生成若干个基于知识图谱(KG)的关系路径作为推理规划。这些关系路径捕捉了实体间的语义关系,并被用作推理答案的规划。

路径检索(Path Retrieval):利用生成的推理规划,从知识图谱中检索有效的推理路径。这一步确保LLM能够获取最新的知识,并基于这些路径进行推理。

推理(Reasoning):基于检索到的推理路径,LLM进行推理并生成答案,同时解释推理过程。

RoG不仅可以从KGs中提取知识,通过训练提高llm的推理能力,这个过程不仅提高了答案的可信度,还增强了解释性。还可以在推理过程中与任意llm无缝集成。

2 两个模块

RoG包含两个组成部分:1)一个规划模块,该模块生成以KGs为基础的关系路径作为可信规划;2)检索推理模块,首先根据计划从KGs中检索有效的推理路径,然后根据检索到的推理路径进行忠实推理,生成具有可解释解释的答案。

尽管LLM具有将关系路径生成为规划的优势,但LLM对KGs中包含的关系一无所知,因此LLM不能直接生成以KGs为基础的关系路径作为可信规划。此外,LLM可能无法正确理解推理路径,并基于它们进行推理。为了解决这些问题,RoG设计了两个指令调优任务:

规划模块优化,将KGs中的知识提取到LLM中以生成忠实关系路径作为规划;

检索-推理模块优化,使LLM能够基于检索到的推理路径进行推理。

3 结语

RoG通过将LLMs与KGs相结合,提出了一种新颖的规划-检索-推理框架,显著提高了LLMs的推理能力和可解释性,并在实验中展示了其在处理高风险场景(如法律判决和医疗诊断)中的潜力,通过提供最新的知识和避免推理过程中的幻觉,RoG提高了LLMs在这些场景中的性能和可信度。

论文题目:Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasonin
论文链接:https://arxiv.org/pdf/2310.01061(发表于ICLR2024)

PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,期待共同进步!
在这里插入图片描述

http://www.lryc.cn/news/387930.html

相关文章:

  • 秋招季的策略与行动指南:提前布局,高效备战,精准出击
  • Java并发编程-wait与notify详解及案例实战
  • 204.贪心算法:分发饼干(力扣)
  • AI奥林匹克竞赛:Claude-3.5-Sonnet对决GPT-4o,谁是最聪明的AI?
  • 【C++】const修饰成员函数
  • 基于模糊神经网络的时间序列预测(以hopkinsirandeath数据集为例,MATLAB)
  • Java web应用性能分析之【prometheus监控K8s指标说明】
  • Spring Boot中的应用配置文件管理
  • SCCB协议介绍,以及与IIC协议对比
  • K8S基础简介
  • Studying-代码随想录训练营day24| 93.复原IP地址、78.子集、90.子集II
  • 2024《汽车出海全产业数据安全合规发展白皮书》下载
  • nvm安装以及idea下vue启动项目过程和注意事项
  • Java SPI服务发现与扩展的利器
  • Ansible的Playbook
  • 多平台自动养号【开心版】偷偷使用就行了!
  • Android与JavaScript的交互,以实现从WebView中打开原生页面并传递参数
  • 信息(文字、图像、音频、视频等)在计算机中是如何存储及显示的
  • 【考研408计算机组成原理】微程序设计重要考点指令流水线考研真题+考点分析
  • 查看哪个docker环境在占用gpu
  • JVM相关总结
  • Python 面试【初级】
  • 机器学习SVR 随机森林 RBF神经网络做回归预测的MATLAB代码
  • Spring Boot中配置Swagger用于API文档
  • 学习java第一百一十六天
  • SQL Server的隐私盾牌:动态数据屏蔽(DMS)全面解析
  • Android中常见的线程池
  • C# YoloV8 模型效果验证工具(OnnxRuntime+ByteTrack推理)
  • 什么是Cookie?有什么用?如何清除浏览器中的Cookie?
  • 数据库基本管理