自监督软提示调优:跨域NLP新突破
自监督的软提示调优方法(SPSS)
这篇论文提出了一种基于自监督的软提示调优方法(SPSS),用于无监督领域自适应。其核心目标是通过挖掘源域和目标域的内部知识,解决传统提示调优在跨域场景中依赖通用知识、模板生成低效的问题。
一、核心实现原理
1. 自监督分层聚类优化(解决领域特征融合问题)
- 原理:从源域和目标域文本中提取名词、形容词等关键特征词,通过分层聚类算法(如K-means)将同类词聚为一组,形成领域专属的标签词集合(Verbalizer)。
- 作用:避免仅依赖预训练模型的通用知识,而是利用领域内高频特征词增强跨域语义对齐。
2. 软提示模板构建(解决模板生成问题)
- 结构:
- 输入层:拼接软提示向量(Soft Toke