当前位置: 首页 > news >正文

FD-Align论文阅读

FD-Align: Feature Discrimination Alignment for Fine-tuning Pre-Trained Models in Few-Shot Learning(NeurIPS 2023)

主要工作是针对微调的和之前的prompt tuining,adapter系列对比

Motivation:

通过模型对虚假关联性的鲁棒性来解释全微调的CLIP的out-of-distribution(OOD)性能变差的原因。虚假关联性的鲁棒性指的是模型是否具有区分出样本中和类别相关信息(因果信息)以及(背景、风格等)类别无关信息(虚假信息)的能力。
先前的工作发现,OPENAI 的CLIP对虚假关联性有很好的鲁棒性,因此有很好的OOD性能。然而,全微调的CLIP的OOD性能会下降。对CLIP和全微调后的CLIP的attention map可视化后发现:全微调的CLIP更关注于物体的局部特征,这种对局部信息的注意力使得模型对虚假关联性的鲁棒性变差[3]。
在这里插入图片描述

也就是说,对CLIP进行全微调时,虽然模型更好得学习到了微调样本的因果特征,但是模型对虚假特征的识别能力也变差,导致模型学习到的因果特征不能很好的泛化到未见过样本从而出现过拟合,影响OOD数据上的泛化性。因此,本文提出了一种不影响模型对虚假特征识别能力的微调方法来保证微调后的模型对虚假关联性的鲁棒性。

因果特征:代表和类别相关的特征
虚假特征:和类别上下文相关的特征

贡献

提出了虚假特征约束(Spurious Feature Constraint),用于微调CLIP,通过约束模型在微调前后提取的图像特征的概率分布,确保了模型提取的虚假特征的一致性

模型

在这里插入图片描述

Spurious Feature Constraint

首先计算每个提示模板Pj的特征在所有类上的平均值作为提示模板Pj的虚假原型
在这里插入图片描述
计算微调模型后提取的特征与虚假原型之间的相似度,生成虚假特征的分布如下
在这里插入图片描述
预训练的视觉编码器 f0(微调前的) 来提取特征并产生虚假特征的分布,如下所示
在这里插入图片描述
loss:KL散度保持模型虚假特征上的概率分布在微调前后一致

在这里插入图片描述
总LOSS:
在这里插入图片描述

Spurious Prototype Correction

目前的提示模板大多是人工设计或者语言模型生成,难免会出现不合理或者冗余的情况,从而导致虚假信息原型不准确。 为此,首先使用异常值检测算法来删除不合理的提示特征
在这里插入图片描述
随后,使用k-Means合并其中的冗余特征
在这里插入图片描述

部分实验

在这里插入图片描述

ref

https://zhuanlan.zhihu.com/p/663423245

http://www.lryc.cn/news/229669.html

相关文章:

  • bug:Junit5报错,@SpringBootTest没有运行
  • Clickhouse学习笔记(4)—— Clickhouse SQL
  • Centos, RockyLinux 常用软件安装汇总
  • Lua更多语法与使用
  • 探秘亚马逊云科技海外服务器 | 解析跨境云计算的前沿技术与应用
  • UnityAI——动物迁徙中的跟随实现实例
  • 堆的应用-----Top k 问题
  • 11月14日星期二今日早报简报微语报早读
  • Spark读取excel文件
  • LLM大语言模型(典型ChatGPT)入门指南
  • Spring IOC - Bean的生命周期之实例化
  • 前端 BUG 总结
  • 【蓝桥杯软件赛 零基础备赛20周】第3周——填空题
  • Pytorch自动混合精度的计算:torch.cuda.amp.autocast
  • 一文看懂香港优才计划和高才通计划的区别和优势?如何选?
  • DTC Network旗下代币DSTC大蒜头即将上线,市场热度飙升
  • 高通SDX12:ASoC 音频框架浅析
  • 国际化:i18n
  • 【机器学习5】无监督学习聚类
  • 风景照片不够清晰锐利,四招帮你轻松解决
  • List中的迭代器实现【C++】
  • VB.NET三层之用户查询窗体
  • Django之路由层
  • 【06】VirtualService高级流量功能
  • 322. 零钱兑换
  • 【大模型-第一篇】在阿里云上部署ChatGLM3
  • 2023-11-14 mysql-主从复制-相关文档
  • ios 对话框 弹框,输入对话框 普通对话框
  • (论文阅读23/100)Hierarchical Convolutional Features for Visual Tracking
  • 基于IGT-DSER智能网关实现GE的PAC/PLC与罗克韦尔(AB)的PLC之间通讯