当前位置: 首页 > news >正文

[论文笔记]Poly-encoder

引言

本文是Poly-encoder1的阅读笔记,论文题目为基于预训练模型的快速准确多句评分模型。

也是本系列第一篇基于Transformer架构的模型,对于进行句子对之间比较的任务,有两种常用的途经:Cross-encoder在句子对上进行交互完全自注意力;Bi-encoder单独地编码不同的句子。前者通常表现更好,但实际中太慢。

本篇工作提出了一种新的Transformer架构,Ploy-encoder,学习了全局而不是标记级自注意特征。Poly-encoder比Cross-encoder快,比Bi-encoder好。

总体介绍

对于句子对比较任务来说,有两种常用的途径:Cross-encoder和Bi-encoder。

Cross-encoder基于给定的输入句子和标签句子(组成一个句子对,将它们拼接在一起作为输入)进行交叉自注意,通常能获得较高的准确率,但速度较慢。

而Bi-encoder单独地对句子对中的句子进行自注意,分别得到句子编码。由于这种独立性,Bi-encoder可以对候选句子进行缓存,从而在推理时只需要计算输入句子的编码表示即可,大大加快推理速度。但是表现没有Cross-encoder好。

本文作者提出了一种新的Transformer结构,Poly-encoder,学习全局级而不是单词级的自注意特征。

Poly-encoder比Cross-encoder快,同时比Bi-encoder更准确。

相关工作

作者称Bi-encoder的方法为单独映射输入和候

http://www.lryc.cn/news/187343.html

相关文章:

  • vs2022中配置PCL1.13.1(附带提供属性表.props文件)
  • 基于共生生物优化的BP神经网络(分类应用) - 附代码
  • GIN框架路由的实现原理
  • Android Studio版本升级后的问题 gradle降级、jdk升级
  • 浏览器插件开发爬虫记录
  • 万万没想到,我用文心一言开发了一个儿童小玩具
  • SQL sever中的视图
  • 如何理解数据序列化
  • 07_项目开发_用户信息列表
  • flutter ios打包
  • 【无公网IP内网穿透】基于NATAPP搭建Web站点
  • 智能AI创作系统ChatGPT详细搭建教程/AI绘画系统/支持GPT联网提问/支持Prompt应用/支持国内AI模型
  • 【技能树笔记】网络篇——练习题解析(五)
  • Java集合(二)--- 集合元素的遍历操作Iterator以及foreach
  • 数据结构:排序- 插入排序(插入排序and希尔排序) , 选择排序(选择排序and堆排序) , 交换排序(冒泡排序and快速排序) , 归并排序
  • IOT 围炉札记
  • 小谈设计模式(24)—命令模式
  • 9.HTML
  • 分层强化学习 综述论文阅读 Hierarchical Reinforcement Learning: A Comprehensive Survey
  • TensorFlow入门(十五、数据读取机制(2))
  • Linux系统中实现便捷运维管理和远程访问的1Panel部署方法
  • Rancher清理节点
  • C++-Mongoose(1)-http-server
  • Linux中openvswitch配置网桥详解
  • Python自动化测试框架pytest的详解安装与运行
  • 23种设计模式详解
  • 微信小程序案例:2-2本地生活
  • 机器学习论文中常用的数学符号以及Latex
  • 【iOS】Fastlane一键打包上传到TestFlight、蒲公英
  • 绝地求生大吃鸡攻略,让你成为顶级战士!