当前位置: 首页 > news >正文

AlpacaFarm: A Simulation Framework for Methods that Learn from Human Feedback

本文是LLM系列文章,针对《》的翻译。

AlpacaFarm:从人类反馈中学习方法的模拟框架

  • 摘要
  • 1 引言
  • 2 背景与问题描述
  • 3 构造AlpacaFarm
  • 4 验证AlpacaFarm模拟器
  • 5 AlpacaFarm的基准参考方法
  • 6 相关工作
  • 7 不足和未来方向

摘要

像ChatGPT这样的大型语言模型由于能够很好地遵循用户指令而被广泛采用。开发这些LLM涉及一个复杂但鲜为人知的工作流程,需要通过人工反馈进行训练。复制和理解此指令跟随过程面临三大挑战:数据收集成本高、缺乏可靠的评估以及缺乏参考方法实现。我们通过AlpacaFarm解决了这些挑战,该模拟器能够以低成本进行研究和开发,从反馈中学习。首先,我们设计LLM提示来模拟人类的反馈,它比众包工作者便宜45倍,并显示出与人类的高度一致性。其次,我们提出了一种自动评估,并根据在现实世界交互中获得的人类指令对其进行验证。第三,我们为从成对反馈中学习的几种方法(PPO、最佳n、专家迭代等)提供了参考实现。最后,作为AlpacaFarm的端到端验证,我们在10k对真实人类反馈上训练和评估了11个模型,并表明在AlpacaFarm中训练的模型排名与在人类数据上训练的模型的排名相匹配。作为对AlpacaFarm可能进行的研究的证明,我们发现使用奖励模型的方法可以显著改善过度监督的微调,并且我们的参考PPO实施导致对Davinci003的胜率提高+10%。

1 引言

2 背景与问题描述

3 构造AlpacaFarm

4 验证AlpacaFarm模拟器

5 AlpacaFarm的基准参考方法

6 相关工作

7 不足和未来方向

GPT4和人类反馈之间的差异。我们的沙箱假设LLM可以模拟人类的反馈。第4节表明,从LLM注释与人类偏好模式一致并复制其许多特征的意义上讲,这一假设成立。然而,我们也观察到,没有一个基于LLM的注释器能够捕捉到人类注释的异质性,并且必须在AlpacaFarm中训练的方法的排名的模拟偏好中注入大量的噪声,以匹配那些用真实人类反馈训练的方法。
此外,我们发现,与人类反馈相比,使用模拟反馈进行训练的学习算法的合适超参数可能不同。例如,由于替代奖励模型的值的尺度的变化,RLHF的合适KL正则化系数的范围是不同的。这表明,AlpacaFarm模拟器目前并不总是适合帮助进行超参数调整,以提高人类评估的性能。
最后,我们注意到,我们的偏好模拟器针对我们招募的众包工作者进行了验证,并因此模拟了他们的偏好可变性。将见解转移到其他更一致的众包池的最佳提示可能涉及较低级别的噪音或较小的提示集合。

http://www.lryc.cn/news/134677.html

相关文章:

  • 【Linux】Linux工具篇(yum、vim、gcc/g++、gdb、Makefile、git)
  • 自己实现 SpringMVC 底层机制 系列之-实现任务阶段 5- 完成 Spring 容器对象的自动装配 -@Autowried
  • linux的http服务
  • Restful架构简单了解
  • conda常用命令
  • Linux:shell脚本:基础使用(6)《正则表达式-awk工具》
  • 国际阿里云腾讯云:阿里云服务器怎么打包
  • FPGA中锁存器(latch)、触发器(flip-flop)以及寄存器(register)详解
  • 【正点原子STM32连载】第十八章 通用定时器PWM输出实验 摘自【正点原子】APM32F407最小系统板使用指南
  • 分类预测 | MATLAB实现BWO-TCN-Attention数据分类预测
  • 6.链路追踪-Zipkin
  • 基于ACF,AMDF算法的语音编码matlab仿真
  • python 基础篇 day 1 初识变量和数据类型
  • Window下部署使用Stable Diffusion AI开源项目绘图
  • 【MySQL】好好学习一下InnoDB中的页
  • git开发常用命令
  • WEB APIs day5
  • html动态爱心代码【一】(附源码)
  • 【仿写tomcat】六、解析xml文件配置端口、线程池核心参数
  • Android Studio 接入OpenCV最简单的例子 : 实现灰度图效果
  • (1)、扩展SpringCache一站式解决缓存击穿,穿透,雪崩
  • Rancher使用cert-manager安装报错解决
  • Harvard transformer NLP 模型 openNMT 简介入门
  • 【数据结构OJ题】用栈实现队列
  • 通达信指标公式15:除权除息数据统计分析
  • day-27 代码随想录算法训练营(19)回溯part03
  • CSDN编程题-每日一练(2023-08-22)
  • 使用 KubeBlocks 为 K8s 提供稳如老狗的数据库服务
  • SFL212B-10-21-15、SFL212B-20-21-40喷嘴挡板伺服阀
  • 阿里云100元预算可选的云服务器配置2核2G3M带宽