当前位置: 首页 > news >正文

[论文笔记]SiameseNet

引言

这是Learning Text Similarity with Siamese Recurrent Networks的论文笔记。

论文标题意思是利用孪生循环神经网络学习文本相似性。

什么是孪生神经网络呢?满足以下两个条件即可:

  • 输入是成对的
  • 网络结构和参数共享(即同一个网络)

如下图所示:

image-20230903095940052

看到这种图要知道可能代表是同一个网络,就如本篇论文中所画的图一样。这种画法重点可能在于强调这两个输入是独立的,即互相是没有交互的。

本文描述的场景是岗位标准化(job title normalization),目的是接收一个字符串将其映射到一个有限的岗位编码。虽然这可以通过一个多分类来解决,但作者这里尝试学习一个字符串的表示,使得同义的岗位在表示上更近。比如"软件工程师"和"X工"(很多公司喜欢用姓+工来称呼不熟的同事,有些不是的,比如平安是通过名+老师来称呼)。

这种做法的灵活性更强,比如,学习到的表示可以作为分类器的输入,也可以用于找到相似字符串或用于聚类。

作者说该模型的优越性在于可以学到不同文本之间的语义差异性(semantic differences)和语义不变性(invariant to non-semantic string differences)。比如"Java developer"和"HR manager"看起来不一样

http://www.lryc.cn/news/163579.html

相关文章:

  • 只有个体户执照,可以用来在抖音开店吗?抖店开通问题解答
  • 微服务高可用容灾架构设计
  • 记录docker 部署nessus
  • qt 正则表达式
  • l8-d13 UNIX域套接字
  • @RequiredArgsConstructor(onConstructor=@_(@Autowired))是什么语法?
  • FL Studio Producer Edition 21.0.3.3713中文完整破解版功能特点及安装激活教程
  • Mybatis 动态语言 - mybatis-velocity
  • Fourier傅里叶变换的线性性质和位移性质
  • # 磁盘引导方式相关知识之BIOS、msdos、MBR、UEFI、gpt、esp、csm
  • Java中同时POST文件和提交JSON数据的方法
  • 【React】React获取URL参数,根据URL参数隐藏页面元素
  • 第68步 时间序列建模实战:ARIMA建模(Matlab)
  • Gin学习记录3——模版与渲染
  • Python算法练习 9.11
  • 2023年中秋节和国庆节放假几天?用待办软件记录放假安排并提醒
  • 使用Python实现一个完整的声音采样和模拟,使用采样声音播放输入的文字,实现代码进行详细注释,并进行测试
  • 测试----计算机网络
  • SVN 索引版本与打包版本号不匹配
  • HummerRisk V1.4.1 发布
  • php的html实体和字符之间的转换
  • docker-compose deploy 高可用 elasticsearch TLS
  • 让GPT成为您的科研加速器丨GPT引领前沿与应用突破之GPT4科研实践技术与AI绘图
  • 工业互联网的破局密钥——低代码开发
  • JavaScript知识系列(2)每天10个小知识点
  • Kotlin面向对象基础使用方法(继承、接口、Lambda、空指针检查机制等)
  • Android USB电源管理
  • YOLO目标检测——路标数据集+已标注voc和yolo格式标签下载分享
  • Item-Based Recommendations with Hadoop
  • 基于物理层网络编码的相位同步算法matlab仿真