当前位置: 首页 > news >正文

【AI视野·今日Sound 声学论文速览 第七期】Tue, 19 Sep 2023

AI视野·今日CS.Sound 声学论文速览
Tue, 19 Sep 2023
Totally 1 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Sound Papers

Frame-to-Utterance Convergence: A Spectra-Temporal Approach for Unified Spoofing Detection
Authors Awais Khan, Khalid Mahmood Malik, Shah Nawaz
语音欺骗攻击对自动说话人验证系统构成重大威胁。现有的反欺骗方法通常模拟特定的攻击类型,例如合成攻击或重放攻击。然而,在现实场景中,对策不知道攻击的生成模式,因此需要统一的解决方案。当前的统一解决方案很难检测欺骗伪影,尤其是最近的欺骗机制。例如,欺骗算法会注入光谱或时间异常,这些异常很难识别。为此,我们提出了利用帧级和话语级系数的谱时间融合。我们针对帧级不一致引入了一种新颖的局部谱偏差系数 SDC ,并采用基于双 LSTM 的网络来处理顺序时间系数 STC ,该网络捕获话语级伪影。我们的频谱时间融合策略结合了这些系数,并且自动编码器生成频谱时间偏差系数 STDC 以增强鲁棒性。我们提出的方法解决了多种欺骗类别,包括合成、重放和部分深度伪造攻击。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

http://www.lryc.cn/news/170677.html

相关文章:

  • MySQL 清空表 截断表
  • 2020-2023中国高等级自动驾驶产业发展趋势研究-中国高等级自动驾驶发展近况
  • Spring学习之ImportBeanDefinitionRegistrar接口
  • React 全栈体系(八)
  • 4.开放-封闭原则
  • oracle递归with子句
  • 如何在Proteus进行STM32F103C8T6模拟以及keil5开发
  • C# OpenCvSharp 图片模糊检测(拉普拉斯算子)
  • 志高团队:广阔前景 全新的投资理财体验
  • 基于自编译的onlyoffice镜像,关于修改字体的问题
  • 1.wifi开发,wifi连接初次连接电脑没有识别,搭建环境
  • 【JAVA-Day25】解密进制转换:十进制向R进制和R进制向十进制的过程
  • 牛客网字节面试算法刷题记录
  • QT连接Sqlite
  • ChatGPT AIGC 完成各省份销售动态可视化分析
  • 基于SpringBoot+Vue的餐饮管理系统设计与实现
  • 2023 亲测好用版VScode配置文件
  • jmeter基础压力教程
  • 图片格式大全
  • 5.14.1.2 Get Log Page – Smart Log
  • 【深度学习实验】线性模型(一):使用NumPy实现简单线性模型:搭建、构造损失函数、计算损失值
  • springcloud3 分布式事务-seata的四种模式总结以及异地容灾
  • 【办公类-16-06】20230901大班运动场地分配表-斜线排列、5天循环、不跳节日,手动修改节日”(python 排班表系列)
  • java学习--day13 (static关键字、异常)
  • 英飞凌TC3xx--深度手撕HSM安全启动(五)--TC3xx HSM启动流程、通信机制分析
  • 【窗体】Winform两个窗体之间通过委托事件进行值传递,基础篇
  • mac使用指南
  • Git 版本控制系统 笔记
  • VRTK4⭐四.和 UI 元素交互
  • 【STM32】SDIO—SD 卡读写01