当前位置：首页 > news >正文

Demystifying Prompts in Language Models via Perplexity Estimation

news 2025/8/8 13:25:33

Demystifying Prompts in Language Models via Perplexity Estimation

原文链接

Gonen H, Iyer S, Blevins T, et al. Demystifying prompts in language models via perplexity estimation[J]. arXiv preprint arXiv:2212.04037, 2022.

简单来说就是作者通过在不同LLM和不同任务上的实验，发现低困惑度的prompt更能提升LLM的性能，如下图所示，困惑度和acc大致呈一个负相关的趋势。
在这里插入图片描述
作者为了证明自己的猜想，先手写了少量人工prompt，之后交给LLM paraphrase，包括用命令让LLM直接重写以及来回翻译（翻译成别的语言再翻译回来），从而得到了大量prompt。作者之后测试了这些prompt的性能，并计算了困惑度和表现得相似度，基本都是负相关。
在这里插入图片描述

基于此，作者提出了一种新的prompt方式，也就是先手写，再paraphrase，最后根据困惑度筛选。

http://www.lryc.cn/news/108424.html

相关文章：

WEB集群——http、tomcat

Socks5代理：网络安全与爬虫之利器

如何兼容低版本浏览器

【雕爷学编程】MicroPython动手做（39）——机器视觉之图像基础2

JMeter 的使用

Java语言 Iterator 如何装换成 List

国产GOWIN实现低成本实现CSI MIPI转换DVP

Typescript第六章类型进阶(类型之间的关系，全面性检查，对象类型进阶，函数类型进阶，条件类型等)

kernel32.dll如何修复，快速解决kernel32.dll缺失的方法

初始化前端项目配置 eslint、prettier、husky 等等

嵌入式存储器为AI的实现提供了实现架构

iOS开发-格式化时间显示刚刚几分钟前几小时前等

ffmpeg视频音频命令

Jenkins工具系列 —— Jenkins 安装并启动

使用中间人攻击的arp欺骗教程

设计模式、Java8新特性实战 - List＜T＞抽象统计组件

【JavaEE初阶】博客系统后端

day51-Mybatis-Plus/代码生成器

22.Netty源码之解码器

R语言【Tidyverse、Tidymodel】的机器学习方法

vscode 第一个文件夹在上一层文件夹同行,怎么处理

[JavaScript游戏开发] 绘制冰宫宝藏地图、人物鼠标点击移动、障碍检测

【NLP概念源和流】 01-稀疏文档表示（第 1/20 部分）

服务器运行python程序的使用说明

8.2一日总结

JavaScript（四）DOM及CSS操作

window中，关闭java占用端口的进程

【Python】PySpark 数据计算 ⑤ ( RDD#sortBy方法 - 排序 RDD 中的元素 )

Elasticsearch官方测试数据导入