当前位置: 首页 > news >正文

Demystifying Prompts in Language Models via Perplexity Estimation

Demystifying Prompts in Language Models via Perplexity Estimation

原文链接

Gonen H, Iyer S, Blevins T, et al. Demystifying prompts in language models via perplexity estimation[J]. arXiv preprint arXiv:2212.04037, 2022.

简单来说就是作者通过在不同LLM和不同任务上的实验,发现低困惑度的prompt更能提升LLM的性能,如下图所示,困惑度和acc大致呈一个负相关的趋势。
在这里插入图片描述
作者为了证明自己的猜想,先手写了少量人工prompt,之后交给LLM paraphrase,包括用命令让LLM直接重写以及来回翻译(翻译成别的语言再翻译回来),从而得到了大量prompt。作者之后测试了这些prompt的性能,并计算了困惑度和表现得相似度,基本都是负相关。
在这里插入图片描述
在这里插入图片描述
基于此,作者提出了一种新的prompt方式,也就是先手写,再paraphrase,最后根据困惑度筛选。
在这里插入图片描述

http://www.lryc.cn/news/108424.html

相关文章:

  • WEB集群——http、tomcat
  • Socks5代理:网络安全与爬虫之利器
  • 如何兼容低版本浏览器
  • 【雕爷学编程】MicroPython动手做(39)——机器视觉之图像基础2
  • gitlab搭建
  • JMeter 的使用
  • Java语言 Iterator 如何装换成 List
  • 国产GOWIN实现低成本实现CSI MIPI转换DVP
  • Typescript第六章 类型进阶(类型之间的关系,全面性检查,对象类型进阶,函数类型进阶,条件类型等)
  • kernel32.dll如何修复,快速解决kernel32.dll缺失的方法
  • 初始化前端项目配置 eslint、prettier、husky 等等
  • 嵌入式存储器为AI的实现提供了实现架构
  • iOS开发-格式化时间显示刚刚几分钟前几小时前等
  • ffmpeg视频音频命令
  • Jenkins工具系列 —— Jenkins 安装并启动
  • 使用中间人攻击的arp欺骗教程
  • 设计模式、Java8新特性实战 - List<T> 抽象统计组件
  • 【JavaEE初阶】博客系统后端
  • day51-Mybatis-Plus/代码生成器
  • 22.Netty源码之解码器
  • R语言【Tidyverse、Tidymodel】的机器学习方法
  • vscode 第一个文件夹在上一层文件夹同行,怎么处理
  • [JavaScript游戏开发] 绘制冰宫宝藏地图、人物鼠标点击移动、障碍检测
  • 【NLP概念源和流】 01-稀疏文档表示(第 1/20 部分)
  • 服务器运行python程序的使用说明
  • 8.2一日总结
  • JavaScript(四)DOM及CSS操作
  • window中,关闭java占用端口的进程
  • 【Python】PySpark 数据计算 ⑤ ( RDD#sortBy方法 - 排序 RDD 中的元素 )
  • Elasticsearch官方测试数据导入