当前位置: 首页 > news >正文

论文速读:Do Generated Data Always Help Contrastive Learning?

  • 在对比学习领域,最近很多研究利用高质量生成模型来提升对比学习
    • 给定一个未标记的数据集,在其上训练一个生成模型来生成大量的合成样本,然后在真实数据和生成数据的组合上执行对比学习
    • 这种使用生成数据的最简单方式被称为“数据膨胀
    • 与数据增强过程正交,其中无论是原始还是生成的图像都会经过手动增强以产生在对比学习中使用的正负样本对

  • 论文发现:生成的数据并不总是有利于对比学习
    • 仅仅将CIFAR-10通过DDPM生成的100万图像进行数据膨胀,反而导致线性探测精度更差

  • ——>论文从两个方面调查这种意外的性能下降
    • 数据膨胀(如何构建膨胀数据)
      • 更好的生成质量帮助有限,而重新加权真实数据和生成数据可以获得更大的收益
    • 数据增强(如何使用膨胀数据制作增强样本)
      • 尽管在标准对比学习中有害,但较弱的数据增强与数据膨胀结合使用时可以非常有益
  • ——》建立了第一个针对膨胀对比学习的普遍性保证,并通过揭示数据膨胀和数据增强之间的互补作用来解释弱增强的好处
  • 基于这些见解,论文提出了一种自适应膨胀(AdaInf)策略,该策略可以自适应调整数据增强的强度和混合比例,从而在不增加任何计算开销的情况下显著提高下游性能
http://www.lryc.cn/news/339374.html

相关文章:

  • 华为欧拉系统(openEuler-22.03)安装深信服EasyConnect软件(图文详解)
  • git commit --amend用法
  • 分布式系统:缓存与数据库一致性问题
  • JavaEE企业开发新技术5
  • mysql dump导出导入数据
  • 刷题记录3
  • Decorator 装饰
  • SpringMVC:搭建第一个web项目并配置视图解析器
  • 一文了解HTTPS的加密原理
  • Ubuntu系统空间整理
  • PHP Storm 2024.1使用
  • 王东岳-知鱼之乐【边读边记】1
  • 迁移docker部署的GitLab
  • 今年消费新潮流:零元购商业模式
  • Go导入私有仓库
  • GIS GeoJSON数据获取
  • 书生·浦语大模型实战营 | 第3次学习笔记
  • easyExcel - 按模板导出
  • 使用 Tranformer 进行概率时间序列预测实战
  • LLM大语言模型助力DataEase小助手,新增气泡地图,DataEase开源数据可视化分析平台v2.5.0发布
  • 维修伊顿触摸屏不显示工业电脑人机界面EATON XVS-430-10MPI-1-10 深圳捷达工控维修
  • 趣话最大割问题:花果山之群猴博弈
  • 上周面试了一个大模型算法岗的女生,有点崩溃。。。
  • AI系列:大语言模型的function calling
  • conda 创建、激活、退出、删除虚拟环境
  • 【Entity Framework】聊一聊EF中继承关系
  • curaengine编译源码之libarcus编译记录
  • 运用OSI模型提升排错能力
  • 【Node.js】Express学习笔记(黑马)
  • Linux系统部署Tale个人博客并发布到公网访问