当前位置: 首页 > news >正文

论文笔记:Are Human-generated Demonstrations Necessary for In-context Learning?

iclr 2024 reviewer 评分 6668

1 intro

  • 大型语言模型(LLMs)已显示出在上下文中学习的能力
    • 给定几个带注释的示例作为演示,LLMs 能够为新的测试输入生成输出
  • 然而,现行的上下文学习(ICL)范式仍存在以下明显的缺点
    • 最终性能极度敏感于选定的演示示例,到目前为止,还没有公认的完美演示选择标准
    • 制作演示可能是劳动密集型的,麻烦的甚至是禁止性的
      • 在许多 ICL 场景中,演示不仅包含输入和相应的标签,还包括由注释者生成的推理过程
      • 对于许多任务(例如,摘要),人类难以表达决策背后的推理过程。
  • 论文提问:我们真的需要人类为 LLMs 提供演示吗,还是 LLMs 可以自己生成演示?
    • ——>提出了自我反思提示策略(简称 SEC)
      • 不使用手工制作的示例作为演示,而是要求 LLMs 首先自行创建演示,基于这些演示生成最终输出
      • SEC 有效地解决了 ICL 的缺点:它不仅可以节省制作演示的繁重劳动,更重要的是,消除了人工制作提示的不稳定性

2 方法

2.1 Vanilla SEC

2.2 COT-SEC        

原理和2.1是一样的,之不多这边让大模型同时给出推导和答案的样例

3 实验

3.1 不同数据集希望LLM 生成的案例数量 

3.2 结果比较

3.2 生成的案例数量的影响

3.3 prompt举例

4 reviewer 意见整理

4.1 reviewer1 (6)

4.2 reviewer2(6)

4.3 reviewer3(6)

4.4 reviewer4(8)

 

http://www.lryc.cn/news/341076.html

相关文章:

  • C语言 | Leetcode C语言题解之第28题找出字符串中第一个匹配项的下标
  • 「Python大数据」数据采集-某东产品数据评论获取
  • ORACLE错误提示概述
  • 2024年4月13日美团春招实习试题【第一题:好子矩阵】-题目+题解+在线评测【模拟】
  • ssm057学生公寓管理中心系统的设计与实现+jsp
  • 循环神经网络(RNN):概念、挑战与应用
  • UML 介绍
  • Pytorch——训练时,冻结网络部分参数的方法
  • 制冷铜管焊接介绍
  • spring06:mybatis-spring(Spring整合MyBatis)
  • 如何使用自定义Promptbooks优化您的安全工作流程
  • Text2sql的一些技巧
  • aws云靶场和一些杂记
  • 《AI编程类工具之四——GitHub copiot》
  • Unity类银河恶魔城学习记录13-1 p142 Save system源代码
  • 【C++杂货铺】继承
  • 快速上手Linux核心命令
  • 背 单 词 (考研词汇闪过)
  • 数据库工具解析之 OceanBase 数据库导出工具
  • [Algorithm][滑动窗口][长度最小的子数组] + 滑动窗口原理
  • .NET 发布,部署和运行应用程序
  • B树(B-tree)
  • EelasticSearch是什么?及EelasticSearch的安装
  • Python机器学习项目开发实战:如何进行语音识别
  • 2024年五一杯数学建模C题思路分析
  • 【代码】Python3|Requests 库怎么继承 Selenium 的 Headers (2024,Chrome)
  • JAVA程序设计-对象设计
  • 蓝桥杯2024年第十五届省赛真题-R 格式
  • Linux服务器硬件及RAID配置
  • 前端 vue单页面中请求数量过多问题 控制单页面请求并发数