当前位置: 首页 > news >正文

[论文笔记]Sentence-BERT[v2]

引言

本文是SBERT(Sentence-BERT)论文1的笔记。SBERT主要用于解决BERT系列模型无法有效地得到句向量的问题。很久之前写过该篇论文的笔记,但不够详细,今天来重新回顾一下。

BERT系列模型基于交互式计算输入两个句子之间的相似度是非常低效的(但效果是很好的)。当然可以通过批数据优化,将query和多个待比较句子分别拼接成批大小内的样子一次输入,是可以同时计算批大小个样本之间的相似度的,但仍然受限于资源。

本篇工作,作者提出了Sentence-BERT(SBERT),一种预训练BERT网络的修改,利用孪生和三胞胎网络来推导出具有语义信息的句嵌入,这些句嵌入能直接通过余弦相似度比较。

总体介绍

SBERT可以计算出包含语义信息的句向量,可以做到之前BERT不能做的事。比如大规模语义相似度比较、聚类以及基于语义搜索的信息检索。

BERT在语句分类和语句对回归任务上取得了SOTA结果。BERT作为cross-encoder:两个语句拼接在一起传递给transformer网络来预测目标值。然而,这种方式不太适合于数据规模太大的场景。比如要比较n=10000个语句两个之间的结果需要 n ⋅ ( n − 1

http://www.lryc.cn/news/198671.html

相关文章:

  • 虚拟机ubantu系统突然重启失去网络
  • 三款经典的轮式/轮足机器人讲解,以及学习EG2133产生A/B/C驱动电机。个人机器人学习和开发路线(推荐)
  • apache开启https
  • 绝地求生游戏缺少msvcp140.dll丢失打不开怎么办?这6个方法都能修复
  • 【广州华锐互动】石油钻井井控VR互动实训系统
  • 单链表算法经典OJ题
  • Picnic master project interview
  • nginx部署vue项目(访问路径加前缀)
  • element-ui中表格树类型数据的显示
  • 【扩散模型】如何用最几毛钱生成壁纸
  • 零基础Linux_17(进程间通信)VSCode环境安装+进程间通信介绍+pipe管道mkfifo
  • Redis的BitMap使用
  • java并发编程之基础与原理1
  • ⟨A⟩ = Tr(ρA) 从数学上来讲什么意思
  • Vue中的v-model指令的原理是什么?
  • 2023服务端测试开发必备技能:Mock测试
  • ExoPlayer架构详解与源码分析(5)——MediaSource
  • 控制一个游戏对象的旋转和相机的缩放
  • 【数据结构】线性表(二)单链表及其基本操作(创建、插入、删除、修改、遍历打印)
  • label的作用是什么?是怎么用的?(1)
  • C- 使用原子变量实现自旋锁
  • 汇编的指令
  • 《数据结构、算法与应用C++语言描述》使用C++语言实现数组队列
  • 零基础如何学习自动化测试
  • 系统架构师备考倒计时16天(每日知识点)
  • 【MySQL系列】- Select查询SQL执行过程详解
  • 软考高级信息系统项目管理师系列之:信息系统项目管理师论文评分参考标准
  • MyBatis--多案例让你熟练使用CRUD操作
  • 用Python造轮子
  • ARM 堆栈寻址类型区分