当前位置: 首页 > news >正文

【AI视野·今日Sound 声学论文速览 第八期】Wed, 20 Sep 2023

AI视野·今日CS.Sound 声学论文速览
Wed, 20 Sep 2023
Totally 1 papers
👉上期速览✈更多精彩请移步主页

Daily Sound Papers

Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation
Authors Yatong Bai, Trung Dang, Dung Tran, Kazuhito Koishida, Somayeh Sojoudi
扩散模型为绝大多数文本到音频 TTA 生成方法提供支持。不幸的是,由于对底层去噪网络的迭代查询,这些模型的推理速度较慢,因此不适合推理时间或计算限制的场景。这项工作修改了最近提出的一致性蒸馏框架,以训练仅需要单个神经网络查询的 TTA 模型。除了将无分类器指导纳入蒸馏过程之外,我们还利用蒸馏训练期间生成的音频的可用性,通过音频空间中的新颖损失函数(例如 CLAP 分数)来微调一致性 TTA 模型。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

http://www.lryc.cn/news/215618.html

相关文章:

  • 【HSPICE仿真】输入网表文件(6)用户自定义分析输出(.measure)
  • 安装Oracle 11g Error in invoking target报错
  • AlarmManager闹钟管理者
  • Opencv实现的三次样条曲线(Cubic Spline)插值
  • 【ElasticSearch系列-03】ElasticSearch的高级句法查询Query DSL
  • 【C++ 系列文章 -- 程序员考试 201811 下午场 C++ 专题 】
  • javaEE -15( 13000字 JavaScript入门 - 2)
  • AWS SAP-C02教程11-解决方案
  • ClickHouse Java多参UDF
  • 修改Typora默认微软雅黑字体
  • ESP32网络开发实例-Web服务器显示LM35传感器数据
  • ATFX汇市:美联储11月利率决议再暂停加息,紧缩货币政策或已接近尾声
  • g.Grafana之Gauge的图形说明
  • MySQL笔记--Ubuntu安装MySQL并基于C++测试API
  • 与AI对话的艺术:如何优化Prompt以获得更好的响应反馈
  • outlook是什么软件outlook邮箱撤回邮件方法
  • 电脑如何录制小视频
  • vue使用百度富文本
  • 【Springboot】集成Swagger
  • [SpringCloud | Linux] CentOS7 部署 SpringCloud 微服务
  • 阿里面试:让代码不腐烂,DDD是怎么做的?
  • NoSQL数据库使用场景以及架构介绍
  • RFID系统提升物流信息管理效率应用解决方案
  • ONNX的结构与转换
  • vue3中,使用html2canvas截图包含视频、图片、文字的区域
  • 后端神器!代码写完直接调试!
  • MATLAB | 万圣节来画个简单的可爱鬼叭!
  • 贪心算法学习------优势洗牌
  • 音视频rtsp rtmp gb28181在浏览器上的按需拉流
  • Java 算法篇-深入了解二分查找法