当前位置: 首页 > news >正文

为什么 GAN 不好训练

        为什么 GAN 不好训练?先看 GAN 的损失:

      当生成器固定时,堆D(x)求导,推理得到(加号右边先对log求导,再对负项求导)

        然后在面对最优Discriminator时,Generator的优化目标就变成了:

        上式可以变成:

        也就是说,如果把Discriminator训练到极致,那么整个GAN的训练目标就成了最小化真实数据分布与合成数据分布之间的JS散度。。。

        考虑如下二维空间中的两个分布P1和P2,P1在线段AB上均匀分布,P2在线段CD上均匀分布,通过控制参数θ可以控制着两个分布的距离远近。则:

         此时,JS散度值为常数,无法传递梯度,梯度消失了。也就是说,如果Discriminator训练得太好,Generator就无法得到足够的梯度继续优化,而如果Discriminator训练得太弱,指示作用不显著,同样不能让Generator进行有效的学习。这样一来,Discriminator的训练火候就非常难把控,这就是GAN训练难的根源。

        实际上,JS散度出现为常数的概率非常大,当数据分布类似高维空间中的低维流形,如下图时,虽然数据分布处理三维空间,本质展开是个二维平面。


    除此之外, GAN 的训练过程中,生成器和判别器的loss无法指示进程,也就是说,我们无法通过生成器与判别器的loss来判断我们生成的图像是否到达了我们所满意的情况。只能通过显示训练图像自行感受训练程度。生成样本缺乏多样性。容易产生模型崩坏,即生成的图像中有着大量的重复图像。

http://www.lryc.cn/news/261057.html

相关文章:

  • select、poll、epoll 区别有哪些
  • 大模型下开源文档解析工具总结及技术思考
  • 【华为数据之道学习笔记】5-4 数据入湖方式
  • Vue3-03-reactive() 响应式基本使用
  • OpenAI开源超级对齐方法:用GPT-2,监督、微调GPT-4
  • TeeChart.NET 2023.11.17 Crack
  • 计算机网络常见的缩写
  • vue cli 脚手架之配置代理
  • STM32启动流程详解(超全,startup_stm32xx.s分析)
  • 小程序接口OK,桌面调试接口不行
  • 【贪心】LeetCode-406. 根据身高重建队列
  • 【C++11特性篇】C++11中新增的initializer_list——初始化的小利器
  • springboot(ssm宠物美容机构CRM系统 宠物服务商城系统Java系统
  • LSTM 双向 Bi-LSTM
  • 2024测试开发面试题完整版本(附答案)
  • MySQL作为服务端的配置过程与实际案例
  • Appium 自动化自学篇 —— 初识Appium自动化!
  • Linux基本操作指令
  • 探索SD-WAN技术对传统制造业实现智能制造的作用
  • C++基础-this指针详解
  • 如何一键生成多个文件二维码?批量文件二维码制作技巧
  • SQL连续
  • sql server导出与导入
  • DevEco Studio 项目鸿蒙(HarmonyOS)资源引用(自定统和系统)
  • 使用国内镜像源安装opencv
  • 人工智能与大数据的紧密联系
  • macbookpro 2024怎么恢复出厂设置
  • Linux系统编程(二):标准 I/O 库(下)
  • Mr. Cappuccino的第65杯咖啡——MacOS安装Docker
  • 解决 Docker Hub 国内无法访问的方法(Docker 镜像下载加速)