当前位置: 首页 > news >正文

【LLM 论文】Step-Back Prompting:先解决更高层次的问题来提高 LLM 推理能力

论文:Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models

⭐⭐⭐⭐

Google DeepMind, ICLR 2024, arXiv:2310.06117

论文速读

该论文受到的启发是:人类再解决一个包含很多细节的具体问题时,先站在更高的层次上解决一些更加抽象的问题,可以拓展一个更宽阔的上下文环境,从而辅助解决这个具体的问题。

反应到 LLM 中,就是当问 LLM 一个具体的物理题目时,先让 LLM 解决一个更加高层次的抽象问题 这个问题背后用得到物理定律或法则是什么? ,然后再让 LLM 去解决那个包含了很多细节的具体的物理题目,可能效果就会更好,准确率更高。

因此,本论文提出了 Step-Back 的 prompting 思路,示例如下:

image-20240510214918541

如上图所示,上半部分中,original question 是一个具体的物理问题,Step-Back Prompting 先让 LLM 进行抽象得到一个 StepBack Question,也就是“这个物理问题背后的物理定律是什么”,然后再去检索这个 StepBack Question 得到相关事实,然后基于以上信息去让 LLM 做 reasoning 得到 final answer。

简而言之,Step-Back Prompting 包含两个简单的步骤

  • Abstraction:先让 LLM 根据 original question 提出一个更高层次概念的 step-back question,并检索这个 step-back question 的相关事实
  • Reasoning:基于高层次概念或原则的事实,LLM 就可以去推理原始问题的解决方案了。

分析讨论

StepBack Prompting 思路中的“抽象”通过去除不相关的细节和提炼高级概念或原则来指导具体问题的解决

通过实验分析,abstraction 对于 LLM 来说是一个简单的任务,通过一些 few-shot exemplar 即可使用 in-context learning 来学会,但 reasoning 对于 LLM 来说仍然是最难学会的任务,在多个 error cases 上做分析,推理仍然是主要的错误来源。

http://www.lryc.cn/news/345582.html

相关文章:

  • Java——接口的补充
  • word转pdf的java实现(documents4j)
  • 基于K8S构建Jenkins持续集成平台
  • PHPStudy 访问网页 403 Forbidden禁止访问
  • 热爱电子值得做的电子制作实验
  • .class文件启动过程以及文件内容结构讲解
  • 解锁楼宇自动化新维度西门子Insight+BACnet IP I/O控制器
  • 2024.05.10作业
  • 基于POSIX标准库的读者-写者问题的简单实现
  • 重生我是嵌入式大能之串口调试UART
  • 【智能优化算法】蜜獾优化算法(Honey Badger Algorithm,HBA)
  • 【算法与数据结构】数组
  • 【数据结构】队列详解(Queue)
  • Baumer工业相机堡盟工业相机如何通过NEOAPISDK获取相机的Statistics图像传输统计信息(C#)
  • FreeRTOS标准库例程代码
  • wandb: - 0.000 MB of 0.011 MB uploaded持续出现的解决方案
  • 分布式模式让业务更高效、更安全、更稳定
  • 5.11学习记录
  • Java类加载器介绍
  • VC++ PDH/性能计数器
  • C++ 类和对象:面向对象编程基础
  • linux 基础命令使用
  • eve 导入linux
  • vivado新版本兼容老版本,vitis classic兼容sdk教程
  • 02.02.返回倒数第k个节点
  • MongoDB 从部署到掌握
  • electron-vite工具打包后通过内置配置文件动态修改接口地址实现方法
  • 每日一练2024.5.9
  • P2622 关灯问题
  • 从头开始的建材类电商小程序开发指南