当前位置: 首页 > news >正文

Automatically Correcting Large Language Models

本文是大模型相关领域的系列文章,针对《Automatically Correcting Large Language Models: Surveying the landscape of diverse self-correction strategies》的翻译。

自动更正大型语言模型:综述各种自我更正策略的前景

  • 摘要
  • 1 引言
  • 2 自动反馈校正LLM的分类
    • 2.1
    • 2.2
    • 2.3
    • 2.4
    • 2.5
    • 2.6
    • 2.7
  • 3 训练时间校正
  • 4 生成时间校正
  • 5 事后校正
  • 6 应用
  • 7 研究差距与未来方向
  • 8 结论

摘要

大型语言模型(LLM)在一系列NLP任务中表现出了卓越的性能。然而,它们的功效被不受欢迎和不一致的行为所破坏,包括幻觉、不忠实的推理和有毒内容。纠正这些缺陷的一种很有前途的方法是自我纠正,即LLM本身被提示或引导解决其输出中的问题。利用由LLM本身或某些外部系统产生的自动反馈的技术特别令人感兴趣,因为它们是一种很有前途的方法,可以使基于LLM的解决方案更加实用和可部署,只需最少的人工反馈。本文对这类新兴技术进行了全面的综述。我们利用这些策略对最近的一系列工作进行了分析和分类,包括训练时间、生成时间和事后纠正。我们还总结了这一战略的主要应用,最后讨论了未来的方向和挑战。

1 引言

2 自动反馈校正LLM的分类

2.1

2.2

2.3

2.4

2.5

2.6

2.7

3 训练时间校正

4 生成时间校正

5 事后校正

6 应用

7 研究差距与未来方向

8 结论

在本文中,我们对具有自动反馈的自校正大型语言模型进行了全面的综述。我们对各种自我纠正策略进行了广泛的分类和分析,包括训练时间、生成时间和事后纠正。我们还讨论了自我纠正的主要应用领域,包括纠正事实错误、增强推理能力和改进代码生成等。最后,我们概述了该领域的一些潜在未来方向和相关挑战。我们撰写这篇论文的目的是为对这个快速发展的领域感兴趣的读者提供一个全面而有用的资源。为了帮助这项工作,我们在GitHub存储库中创建了一个不断更新的阅读列表:https://github.com/teacherpeterpan/self-correction-llm-papers.

http://www.lryc.cn/news/130063.html

相关文章:

  • 【学习FreeRTOS】第8章——FreeRTOS列表和列表项
  • 分布式图数据库 NebulaGraph v3.6.0 正式发布,强化全文索引能力
  • 在 ubuntu 18.04 上使用源码升级 OpenSSH_7.6p1到 OpenSSH_9.3p1
  • python中可以处理word文档的模块:docx模块
  • TikTok或将于8月底关闭半闭环、速卖通或将推出“半托管”模式
  • 《凤凰架构》第二章——访问远程服务
  • 【Diffusion】李宏毅2023机器学习Diffusion笔记
  • CloudEvents—云原生事件规范
  • 神经网络基础-神经网络补充概念-51-局部最优问题
  • 深度学习中,什么是batch-size?如何设置?
  • [保研/考研机试] KY26 10进制 VS 2进制 清华大学复试上机题 C++实现
  • JSP-学习笔记
  • Golang协程,通道详解
  • unity 之 Vector 数据类型
  • 私密数据采集:隧道爬虫IP技术的保密性能力探究
  • 使用git rebase 之后的如何恢复到原始状态
  • matlab相机标定知识整理
  • win11安装ubuntu 子系统安装过程及注意事项
  • torch.cat((A,B),dim=1)解析
  • apache配置安全证书https踩坑记录
  • SQL Server Express 自动备份方案
  • Docker资源控制
  • 微服务中间件-分布式缓存Redis
  • java面试强基(16)
  • Python可视化在量化交易中的应用(13)_Seaborn直方图
  • NOIP 2006 普及组 第二题 开心的金明
  • 「UG/NX」Block UI 指定点SpecifyPoint
  • Linux Shell如果ping失败就重启网卡(详解)
  • 每天一道leetcode:剑指 Offer 13. 机器人的运动范围(中等广度优先遍历剪枝)
  • TypeError: a bytes-like object is required, not ‘str‘