当前位置: 首页 > news >正文

GAN/cGAN中到底要不要注入噪声

MelGAN

论文MelGAN针对的是从mel谱生成语音,里面说当条件很强的时候,随机噪声就没啥用了,因此没将noise注入到生成器中;

运用的判别器也仅有1个输入,不是cGAN的形式

image-to-image translation with conditional adversarial networks

主要针对图片到图片的转换任务,例如:给定轮廓,利用NN补充细节。也说随机噪声作用不大。文中仅以dropout的形式实现随机噪声,但本文也称自己为GAN。

仅使用L1会得到模糊结果(文中其他地方说用L2会更模糊),仅使用GAN会得到清晰但是有artifact的结果,联合使用L1+GAN效果最好;

L1loss和L2loss在图像问题上会导致模糊现象,但是这两个loss都捕捉到了低频信息。

采用GAN的目的是仅对高频进行建模,L1用来最低频做建模

如下结果表明:相较于GAN,cgan还是有优势的。cgan和gan的区别就是是否将原始特征输入x中;

http://www.lryc.cn/news/601517.html

相关文章:

  • 计算机网络:(十二)传输层(上)运输层协议概述
  • FPGA IP升级
  • Linux文件理解,基础IO理解
  • SCUDATA esProc SPL Enterprise Edition(大数据计算引擎) v20250605 中文免费版
  • Keepalive高可用集群的实验项目
  • 【Java系统接口幂等性解决实操】
  • DeepSeek实战--无头浏览器抓取技术
  • Java常用日志框架介绍
  • 五度标调法调域统计分析工具
  • 设计模式(五)创建型:原型模式详解
  • [spring6: Mvc-异步请求]-源码分析
  • 设计模式(三)创建型:抽象工厂模式详解
  • 微服务架构面试题
  • Flutter开发实战之测试驱动开发
  • linux根据pid获取服务目录
  • Gradio.NET 中文快速入门与用法说明
  • IIS发布.NET9 API 常见报错汇总
  • 从 .NET Framework 到 .NET 8:跨平台融合史诗与生态演进全景
  • 9-大语言模型—Transformer 核心:多头注意力的 10 步拆解与可视化理解
  • 电商项目_核心业务_数据归档
  • Java枚举类enum;记录类Record;密封类Sealed、permits
  • Java面试宝典:MySQL执行原理一
  • 300.最长递增子序列,674. 最长连续递增序列,
  • Ubuntu服务器安装与运维手册——操作纯享版
  • 负载均衡Haproxy
  • [AI8051U入门第十一步]W5500-服务端
  • 嵌入式学习日志————对射式红外传感器计次
  • 【MySQL篇】:MySQL基础了解以及库和表的相关操作
  • DP之背包基础
  • SignalR 全解析:核心原理、适用场景与 Vue + .NET Core 实战