当前位置: 首页 > news >正文

【深度学习】UNIT-DDPM核心讲解

文章目录

      • 大致介绍:
      • 扩散损失:
      • 转换损失:
      • 循环一致性损失:
      • 推理过程:
      • 优缺点:

参考文章:
https://blog.csdn.net/ssshyeong/article/details/127210086
这篇文章对整个文章 UNIT-DDPM: UNpaired Image Translation with Denoising Diffusion Probabilistic Models进行了从头到尾的讲解,可以看一下。在此写一下自己的理解。

大致介绍:

这篇论文提出了一种新的图像翻译方法,即无配对的图像翻译,基于Denoising Diffusion Probabilistic Models(DDPM)。传统的无配对图像翻译方法通常使用对抗生成网络(GAN)或变分自编码器(VAE)来模拟两种语言之间的映射,但这些方法通常需要大量配对的数据来训练模型。而本文提出的方法则不需要配对的数据,因为它使用DDPM来学习两种语言之间的映射。DDPM是一种基于概率模型的去噪方法,可以通过对噪声进行多次迭代来生成清晰图像。本文将DDPM应用于无配对图像翻译,通过对两种语言图片进行多次迭代训练,可以获得较好的翻译效果。

具体来说,本文的方法分为两个步骤:训练阶段和生成阶段。在训练阶段,将DDPM应用于两种语言的图片数据集上,训练出两个DDPM模型。在生成阶段,通过交替对两个DDPM模型进行迭代,将一个语言的图片转换成另一个语言的图片。

本文的方法相对于传统方法的优点是不需要配对的数据,而且生成的图片具有一定的多样性和清晰度。但缺点是训练时间相对较长,因为DDPM模型需要进行多次迭代训练。

总之,本文提出了一种新的无配对图像翻译方法,通过应用DDPM模型实现了两种语言之间的图片转换,为跨语言翻译和相关领域的研究提供了新思路。

图解:
在这里插入图片描述
可以看到,本文使用两个扩散过程(源域和目标域的扩散),以及两个转换函数(将源域转到目标域和将目标域转到源域),也就是图像翻译。
为了使两个域之间能够转换,本文将最p过程进行了修改,使其带有条件。

扩散损失:

首先训练扩散过程中的参数:
在这里插入图片描述
依次排列括号里面的公式:A在t时刻的扩散图像;首先将A域图像转到B上,然后使用A域的扩散得到扩散图像,时刻t (先翻译,后扩散)
B在t时刻的扩散图像;首先将B域图像转到A上,然后使用B域的扩散得到扩散图像;时刻t。

转换损失:

接下来训练翻译函数,固定A和B的扩散参数:
在这里插入图片描述
依次罗列括号里面的公式:
先将B域图像转到A域,然后得到t时刻的扩散图像(A域上);B域图像在t时刻的扩散图像(B域上);时刻t。
B域图像在t时刻的扩散图像(B域上);首先将B域图像转到A上,然后使用B域的扩散得到扩散图像(B域上);时刻t。
后面一个类似。

循环一致性损失:

在这里插入图片描述
最终的损失函数:
在这里插入图片描述

推理过程:

在这里插入图片描述
之后使用DDPM里面的公式对其一步一步推导即可。
在这里插入图片描述

优缺点:

模型图:在这里插入图片描述
扩散模型采样步骤很费时间,可以使用DDIM等方法进行缩减;还可以通过其他trick进行改进生成质量(如注意力机制或者NL等方法)。

http://www.lryc.cn/news/185806.html

相关文章:

  • Java 线程的优先级
  • 金融数学方法:牛顿法
  • MongoTemplate | 多条件查询
  • 优秀程序员是怎么思考的?
  • 【juc】countdownlatch实现游戏进度
  • Spring Webflux HttpHandler源码整理
  • Qt扩展-Advanced-Docking 简介及配置
  • Decorator
  • 分布式文件系统HDFS(林子雨慕课课程)
  • CSS中:root伪类的使用
  • VulnHub JANGOW
  • OpenMesh 获取网格面片各个顶点
  • 【前端设计模式】之原型模式
  • 软件设计原则
  • 【面试HOT100】哈希双指针滑动窗口
  • Ubuntu20.04 配置 yolov5_ros 功能包记录
  • Flink的处理函数——processFunction
  • Linux系统中的ps命令详解及用法介绍
  • 机器学习笔记 - 基于pytorch、grad-cam的计算机视觉的高级可解释人工智能
  • Python 编程基础 | 第五章-类与对象 | 5.1、定义类
  • 合宙Air780e+luatos+腾讯云物联网平台完成设备通信与控制(属性上报+4G远程点灯)
  • c++系列之string的模拟实现
  • Spring的beanName生成器AnnotationBeanNameGenerator
  • FFmpeg 命令:从入门到精通 | ffmpeg 命令直播
  • A (1087) : DS单链表--类实现
  • 异常:找不到匹配的key exchange算法
  • Arcgis打开影像分析窗口没反应
  • Spring(JavaEE进阶系列1)
  • Flink状态管理与检查点机制
  • 【threejs】基本编程概念及海岛模型展示逻辑