当前位置: 首页 > news >正文

[论文笔记]SimCSE

引言

今天带来一篇当时引起轰动的论文SimCSE笔记,论文题目是 语句嵌入的简单对比学习。

SimCSE是一个简单的对比学习框架,它可以通过无监督和有监督的方式来训练。

对于无监督方式,输入一个句子然后在一个对比目标中预测它自己,仅需要标准的Dropout作为噪声。这种简单的方式效果却惊人地好。将Dropout作为小型数据增强,移除Dropout会导致表示坍塌(representation collapse):将所有的句子判断为相似或不相似的。

对于有监督方式,合并NLI数据集有标注数据对到对比学习框架,具体做法是,将蕴含对作为正例,矛盾对作为困难负例。

最后,作者也通过理论和实验表明,对比学习目标正则化预训练嵌入的各向异性(anisotropic)空间成为更均匀,在有监督下能更好地对齐正样本对。

总体介绍

作者提出SimCSE(Simple contrastive sentence embedding)框架,能从无标签和有标签数据中产生优秀的句嵌入。

无监督的SimCSE仅通过dropout作为噪声来简单地预测输入语句本身,如图1(a)。

image-20231014085441471

图1

换言之,将同样的句

http://www.lryc.cn/news/195308.html

相关文章:

  • 设置按键中断,按键1按下,LED亮,再按一次,灭按键2按下,蜂鸣器响。再按一次,不响按键3按下,风扇转,再按一次,风扇停
  • 深拷贝和浅拷贝的主要区别
  • Git Cherry Pick的使用
  • vue3后台管理框架之基础配置
  • Easysearch压缩模式深度比较:ZSTD+source_reuse的优势分析
  • 扩散模型的系统性学习(一):DDPM的学习
  • 注意力屏蔽(Attention Masking)在Transformer中的作用 【gpt学习记录】
  • MyBatisPlus详解
  • 组合数的计算
  • linux之shell记录
  • 外卖大数据案例
  • 到底什么是5G-R?
  • uniapp 使用和引入 thorui
  • vue3中ref和reactive的区别
  • 文件路径操作
  • Java Cache 缓存方案详解及代码-Ehcache
  • JAVA设计模式-装饰者模式
  • STM32F1简介
  • SpringBoot面试题6:Spring Boot 2.X 有什么新特性?与 1.X 有什么区别?
  • qt笔记之qml下拉标签组合框增加发送按钮发送标签内容
  • linux上构建任意版本的rocketmq多架构x86 arm镜像——筑梦之路
  • Java8 新特性之Stream(五)-- Stream的3种创建方法
  • Vue实现模糊查询搜索功能
  • (C++ STL) 详解vector模拟实现
  • c语言从入门到实战——C语言数据类型和变量
  • [论文精读]Semi-Supervised Classification with Graph Convolutional Networks
  • CICD:使用docker+ jenkins + gitlab搭建cicd服务
  • 新能源电池试验中准确模拟高空环境大气压力的解决方案
  • Python 中的模糊字符串匹配
  • 记录一个奇怪bug