当前位置：首页 > news >正文

论文略读：Prefix-Tuning: Optimizing Continuous Prompts for Generation

news 2025/7/9 6:43:26

2021 ACL

固定预训练LM，为LM添加可训练，任务特定的前缀
- 这样就可以为不同任务保存不同的前缀
- 这种前缀可以看成连续可微的soft prompt，相比于离散的token，更好优化，效果更好
训练的时候只需要更新prefix部分的参数，固定LM部分的参数即可

对于自回归模型，在句子前面添加前缀，得到 z = [PREFIX; x; y]

对于encoder-decoder模型：Encoder和Decoder都增加了前缀，得到 z = [PREFIX; x; PREFIX0; y]
- Encoder端增加前缀是为了引导输入部分的编码
- Decoder 端增加前缀是为了引导后续token的生成
- Prefix-tuning略优于Infix-tuning
  - Infix-tuning形式为 [x; INFIX; y]
  - Prefix-tuning形式为 [PREFIX; x; y]
直接学习参数效果不好，需要使用MLP对Pθ进行reparameter修正
- Pθ[i,:] = MLP(Pθ'[i,:])

http://www.lryc.cn/news/582484.html

相关文章：

C++11标准库算法：深入理解std::find, std::find_if与std::find_if_not

Python中os.path和pathlib模块路径操作函数汇总

react的条件渲染【简约风5min】

C#使用Semantic Kernel实现Embedding功能

【知足常乐ai笔记】机器人强化学习

TVS管工作原理是什么？主要的应用场景都有哪些？

MySQL数据库访问（C/C++）

赛博威破解快消品渠道营销三重困局，助力企业实现“活动即战力”

小米YU7预售现象深度解析：智能电动汽车的下一个范式革命

内容页模板表格显示不全的问题处理

IP 能ping通，服务器是否开机？

第8章：应用层协议HTTP、SDN软件定义网络、组播技术、QoS

【快手】数据挖掘面试题0002：求某地铁站每日客流量，乘地铁经过、进出站人都包括在内

Tourism Management and Technology Economy，旅游管理与技术经济知网期刊

Oracle 存储过程、函数与触发器

【OceanBase诊断调优】—— 执行计划显示分区 PARTITIONS[P0SP9] 如何查询是哪个分区？

数据结构与算法：博弈类问题

服务器经常出现蓝屏是什么原因导致的？如何排查和修复？

node.js中yarn、npm、cnpm详解

npm : 无法加载文件 D:\Node\npm.ps1，因为在此系统上禁止运行脚本。

【QT】-隐式转换 explicit用法

React18+TypeScript状态管理最佳实践

说说SpringBoot常用的注解？

【Nginx】Nginx代理WebSocket

Ollama+OpenWebUI 0.42+0.3.35 最新版一键安装教程，解决手动更新失败问题

kafka如何让消息均匀的写入到每个partition

OpenWebUI(5)源码学习-后端socket通信模块

App Trace功能实战：一键拉起应用实践

【保姆级图文详解】RAG 实战（Spring AI + 本地知识库）旅游知识库问答

微软上线 Deep Research 预览版：o3+必应赋能研究自动化