当前位置: 首页 > news >正文

【提示工程】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

解决问题

探索大语言模型解决推理问题的能力。从头训练或微调模型,需要创建大量的高质量含中间步骤的数据集,成本过大。

相关工作

1、使用中间步骤来解决推理问题
(1)使用自然语言通过一系列中间步骤解决数学应用题
(2)通过创建更大的数据集微调语言模型,而不是从头训练
(3)使用语言模型一行一行的预测中间结果预测最终输出

2、采用提示方式
(1)少样本提示
(2)自动学习提示
(3)描述任务的模型指令

本文采用一系列思维来增强语言模型的输出

创新方法

采用由自然语言描述逻辑推理过程,构建成一条解决问题步骤的思维链,以Prompt的形式进行few-shot提示。

优势

(1)可将问题拆解为多个步骤解决
(2)提供可解释性,便于调试
(3)应用任务领域广
(4)加入少量示例就可以引出COT

结论

我们探索了思维链提示作为一个简单且广泛适用的方法来增强语言模型的推理。通过算术推理、符号推理和常识推理的实验,我们发现思维链推理是模型尺度的一种新特性,它允许足够大的语言模型执行原本为平坦尺度曲线的推理任务。扩大语言模型可以执行的推理任务的范围将有望激发基于语言推理方法的进一步工作。

http://www.lryc.cn/news/262951.html

相关文章:

  • AWS解决方案架构师学习与备考
  • 如何搭建企业管理系统Odoo并远程访问管理界面【内网穿透】
  • 【Git】git常用问题汇总
  • 2024免费mac苹果电脑系统电脑管家CleanMyMac X
  • ElasticSearch详细搭建以及常见错误high disk watermark [ES系列] - 第497篇
  • ADB:获取坐标
  • 关于“Python”的核心知识点整理大全27
  • 实验三 MapReduce编程
  • element组件库的日期选择器如何限制?
  • QSqlQueryModel
  • docker-compose介绍和用法
  • Mac下ERROR: Cannot connect to the Docker daemon
  • 本地项目添加到gitlab命令操作
  • t-io 程序执行后,jvm不退出的原因
  • Vue3使用Three.js导入gltf模型并解决模型为黑色的问题
  • 说一下 jvm 有哪些垃圾回收算法?
  • 【23真题】一共10道题,押题卷5道!
  • JS的浅拷贝和深拷贝
  • 天软特色因子看板 (2023.12 第12期)
  • 【Logback技术专题】「入门到精通系列教程」深入探索Logback日志框架的原理分析和开发实战技术指南(上篇)
  • vue3+element Plus 清空el-tree复选框选中项
  • 【VScode】设置语言为中文
  • C++ Qt开发:TableWidget表格组件
  • layui框架实战案例(25):table组件筛选列记忆功能
  • 20、WEB攻防——PHP特性缺陷对比函数CTF考点CMS审计实例
  • 互换数组的两个轴 numpy.swapaxes()
  • 金蝶云星空修改业务对象标识
  • 【PHP入门】2.1-运算符
  • 【Hive】——DML
  • 【Spring教程31】SSM框架整合实战:从零开始学习SSM整合配置,如何编写Mybatis SpringMVC JDBC Spring配置类