当前位置: 首页 > news >正文

Wav2vec2 论文阅读看到的一些问题

Wav2vec2 论文阅读看到的一些问题

这里只是简单的思考一下论文的一些问题,不是论文解读。

Q1. 为什么wav2vec依旧需要Transformer来做推理,而不直接使用VQ生成的内容?
A1. Transformer在更长的序列上有更好的编码效果,例如论文也写Contextualized representations with Transformers。另一个因素在于对比学习本质上是区分相似性,让正样本之间更接近,让正负样本之间更远离,而不是类似CE的完全逼近。参考损失函数:
− l o g e x p ( s i m ( c t , q t ) / κ ) ∑ q ∼ Q t ^ e x p ( s i m ( c t , q ^ ) / κ ) -log \frac{exp(sim(\textbf{c}_t, \textbf{q}_t) / \kappa)}{\sum_{\hat{\textbf{q} \sim \textbf{Q}_t} exp(sim (\textbf{c}_t, \hat{\textbf{q}})/ \kappa)}} logqQt^exp(sim(ct,q^)/κ)exp(sim(ct,qt)/κ)

Q2. VQ是怎么训练的?
A2. 是联合训练的,在训练早期CodeBook是随机初始化。这个一点和HuBERT有一点不太一样,后者是提前预训练。

http://www.lryc.cn/news/116607.html

相关文章:

  • 爬虫学习记录(持续更新)
  • libevent源码学习1---创建event
  • Python类的设计
  • 微信小程序的项目解构
  • 【Archaius技术专题】「Netflix原生态」动态化配置服务之微服务配置组件变色龙
  • python条件分支和循环语句
  • 工具推荐:Wireshark网络协议分析工具(对比tcpdump)
  • [OnWork.Tools]系列 04-快捷启动
  • 如何将项目挂后台运行?【nohup和tmux】
  • 什么是进程、线程、协程
  • Python爬虫——selenium_访问元素信息
  • Linux 文件基本属性
  • CSS 盒模型是什么?它包含哪些属性?标准盒模型/怪异盒模型
  • VB+SQL光盘信息管理系统设计与实现
  • MySQL5.7数据库、Navicat Premium1.6可视化工具安装教程【详细教程】
  • JVM 调优实例
  • Python numpy中的correlate相关性详解
  • 用python实现xmind用例转换为excel/csv用例
  • 论文浅尝 | 面向多步推理任务专业化较小语言模型
  • 基于Java的新闻全文搜索引擎的设计与实现
  • golang 自定义exporter - 端口连接数 portConnCount_exporter
  • MoveTowards详解
  • Redis学习笔记Day01-Redis入门
  • C++ Lambda表达式的完整介绍
  • 【等保测评】云计算Linux服务器(一)
  • [vue-element-admin]下载与安装
  • OPENCV C++(九)鼠标响应+dft+idft
  • python编程求出介于这两个数 之间的所有质数并打印输出。显示格式为“*数是质数
  • 基于Selenium模块实现无界面模式 执行JS脚本
  • 【LangChain学习】基于PDF文档构建问答知识库(二)创建项目