当前位置: 首页 > news >正文

GAN:WGAN前作

WGAN前作:有原则的方法来训练GANs

论文:https://arxiv.org/abs/1701.04862

发表:ICLR 2017

本文是wgan三部曲的第一部。文中并没有引入新的算法,而是标是朝着完全理解生成对抗网络的训练动态过程迈进理论性的一步。

文中基本是理论公式的推导,看起来确实头大,偷懒就直接阅读网上整理好的资料了,参考

1:译文

2:生成模型(一):GAN - 知乎

3:令人拍案叫绝的Wasserstein GAN - 知乎

梯度消失

文章花了大量的篇幅进行数学推导,证明在一般的情况,如果Discriminator训练得太好,Generator就无法得到足够的梯度继续优化,而如果Discriminator训练得太弱,指示作用不显著,同样不能让Generator进行有效的学习。这样一来,Discriminator的训练火候就非常难把控,这就是GAN训练难的根源。

实验验证:基于DCGAN,分别训练1、10、25epoch,固定Generator,然后从头开始训练Discriminator,绘制出Generator目标函数梯度和训练迭代次数的关系如下。可以看到,经过25 epochs的训练以后,Generator得到的梯度已经非常小了,出现了明显的梯度消失问题。

梯度不稳定

实验验证:基于DCGAN,分别训练1、10、25epoch,固定Generator,然后从头开始训练Discriminator,绘制出梯度信息。可以看出更有明显的梯度方差较大的缺陷,导致训练的不稳定。在训练的早期(训练了1 epoch和训练了10 epochs),梯度的方差很大,对应的曲线看起来比较粗,直到训练了25 epochs以后GAN收敛了才出现方差较小的梯度。

本文的解决方案: 添加噪声

为增加两个概率分布创造更高的重叠机会,一种解决方案是在判别器的输入上添加连续噪声.

http://www.lryc.cn/news/249864.html

相关文章:

  • 数据库应用:MongoDB 文档与索引管理
  • Python批处理PDF文件,PDF附件轻松批量提取
  • Python可迭代对象排序:深入排序算法与定制排序
  • 基于matlab的图像去噪算法设计与实现
  • NFTScan 正式上线 Starknet NFTScan 浏览器和 NFT API 数据服务
  • 2023年亚太杯APMCM数学建模大赛A题水果采摘机器人的图像识别
  • mysql which is not in SELECT list; this is incompatible with DISTINCT解决方案
  • linux /proc 文件系统
  • java开发之个微群聊自动添加好友
  • Git .gitignore 忽略文件不生效解决方法
  • 【Java】16. HashMap
  • KMP基础架构
  • 递归实现选择排序.
  • Node.js【文件系统模块、路径模块 、连接 MySQL、nodemon、操作 MySQL】(三)-全面详解(学习总结---从入门到深化)
  • 公司的销售经理面临哪些压力和挑战?
  • 【Linux系统编程】如何创建进程(什么是fork函数?进程创建的原理是什么?)
  • 【opencv】计算机视觉基础知识
  • Node——Node.js简介
  • 小型洗衣机什么牌子好又便宜?性价比迷你洗衣机推荐
  • INFINI Easysearch 与华为鲲鹏完成产品兼容互认证
  • 将linux服务器 设置成 proxy.SOCKS5 服务器
  • 无mac电脑生成uniapp云打包私钥证书的攻略
  • py 启动默认浏览器
  • scala可变参数列表使用
  • 经验分享:JMeter控制RPS
  • JavaScript中的for循环你用对了吗?
  • WordPress(10)解决中文连接问题
  • 2023年小美赛认证杯国际赛A题解题思路+数据分享版+部分代码
  • 删除list中除最后一个之外所有的数据
  • 北京筑龙助力中粮集团采购供应链改革加速跑