当前位置: 首页 > news >正文

[论文笔记]DSSM

引言

这是DSSM论文的阅读笔记,后续会有一篇文章来复现它并在中文数据集上验证效果。

本文的标题翻译过来就是利用点击数据学习网页搜索中深层结构化语义模型,这篇论文被归类为信息检索,但也可以用来做文本匹配。

这是一篇经典的工作,在DSSM之前,通常使用传统机器学习的方法,比如LSA、LDA来解决。本篇工作使文本匹配进入了深度学习时代。

摘要

在信息检索中要研究的问题是,给定一个查询(query)和一组文档(documents),返回一个基于匹配度的排序(ranking)文档结果。

作者通过使用DNN将查询和文档映射到一个通用的低维(稠密向量)空间,通过计算该空间中的距离来表示它们的相关性。同时利用词哈希技术解决词表过大问题。

模型的优化策略是,最大化正确标签出现的条件概率,即最小化softmax交叉熵损失。通过不断迭代,希望给定一组query和文档的时候,能最大化地匹配到被点击过的文档的概率。

下面我们直接来看模型的结构。

模型结构

计算语义特征的DNN

image-20230831200632208

如论文中的图1所示,网络的输入是高维稀疏的文本词袋特征词向量(可以理解为ont-hot向量),比如查询或文档中单词的计数,输出是低维语义空间中的稠密向量。

http://www.lryc.cn/news/148271.html

相关文章:

  • Skip Connection——提高深度神经网络性能的利器
  • EXCEL中点击单元格,所在行和列都改变颜色
  • HAProxy(一)
  • LeetCode--HOT100题(46)
  • 深度探索JavaScript中的原型链机制
  • 一种基于WinDump自动抓包实现方法
  • taro 支付宝/微信小程序/h5 上传 - base64的那些事儿
  • java之SpringBoot基础、前后端项目、MyBatisPlus、MySQL、vue、elementUi
  • Vue-Router 一篇搞定 Vue3
  • 深度解读智能媒体服务的重组和进化
  • 亲测有效!Win7中如何安装高版本的NodeJS
  • Python基础__with open()用法
  • 深入理解 JavaScript 对象、属性、解构和增强语法
  • 2023年IT服务行业研究报告
  • 腾讯云服务器镜像TencentOS Server有用过的吗?
  • 小区村庄集中生活废水处理设备厂家直销价格
  • Redisson实现分布式锁案例
  • Generated Knowledge Prompting for Commonsense Reasoning
  • mybatisPlus多数据源方案
  • MonoDETR: Depth-guided Transformer for Monocular 3D Object Detection 论文解读
  • Vulnhub内网渗透DC-7靶场通关
  • acunetix2023安装教程
  • pytest pytest.ini 配置日志输出至文件
  • Linux脚本-将当前文件夹下所有包含main函数的.c文件提取出来
  • Spring依赖注入(DI)
  • 论文笔记: 深度学习速度模型构建的层次迁移学习方法 (未完)
  • 苹果为 Vision Pro 头显申请游戏手柄专利
  • 【数据结构】多叉树转换为二叉树-c++代码实现-POJ 3437 Tree Grafting
  • ASP.NET Core 中基于 Controller 的 Web API
  • iOS系统修复软件 Fix My iPhone for Mac