当前位置: 首页 > news >正文

AIGC笔记--基于DDPM实现图片生成

目录

1--扩散模型

2--训练过程

3--损失函数

4--生成过程

5--参考


1--扩散模型

完整代码:ljf69/DDPM

扩散模型包含两个过程,前向扩散过程和反向生成过程。

前向扩散过程对一张图像逐渐添加高斯噪声,直至图像变为随机噪声。

反向生成过程从一个随机噪声开始,逐渐去噪声直至生成一张图像。

2--训练过程

通过以下公式对图像进行加噪:

def forward(self, x0, t, eta = None):n, c, h, w = x0.shape # 输入图片的shapea_bar = self.alpha_bars[t]if eta is None:eta = torch.randn(n, c, h, w).to(self.device)noisy = a_bar.sqrt().reshape(n, 1, 1, 1) * x0 + (1 - a_bar).sqrt().reshape(n, 1, 1, 1) * eta # 加噪return noisy # 返回加噪结果

3--损失函数

通过一个UNet网络来预测损失,计算预测损失和真实损失MSE损失:

...
eta = torch.randn_like(x0).to(device) # 产生真实随机噪声
t = torch.randint(0, n_steps, (n,)).to(device)# 前向扩散过程
noisy_imgs = ddpm(x0, t, eta)# 通过UNet预测噪声
eta_theta = ddpm.backward(noisy_imgs, t.reshape(n, -1))# 计算预测噪声和真实随机噪声的MSE损失
loss = mse(eta_theta, eta)
...

4--生成过程

通过以下公式实现图片生成:

x = torch.randn(n_samples, c, h, w).to(device) # 随机初始化噪声
for idx, t in enumerate(list(range(ddpm.n_steps))[::-1]):time_tensor = (torch.ones(n_samples, 1) * t).to(device).long()eta_theta = ddpm.backward(x, time_tensor)alpha_t = ddpm.alphas[t]alpha_t_bar = ddpm.alpha_bars[t]x = (1 / alpha_t.sqrt()) * (x - (1 - alpha_t) / (1 - alpha_t_bar).sqrt() * eta_theta) # 去噪if t > 0:z = torch.randn(n_samples, c, h, w).to(device)beta_t = ddpm.betas[t]sigma_t = beta_t.sqrt()x = x + sigma_t * z

5--参考

怎么理解今年 CV 比较火的扩散模型(DDPM)

http://www.lryc.cn/news/204636.html

相关文章:

  • 三十七、【进阶】SQL的explain
  • 【Python】取火柴小游戏(巴什博弈)
  • 030-第三代软件开发-密码输入框
  • mysql读取文件
  • CentOS(5)——rpm包和源码包区别
  • Golang 实现对配置文件加密
  • MYSQL数字函数详解和实战(数字函数大全,内含示例)
  • Linux系列讲解 —— VIM配置与美化
  • FreeSWITCH 使用指北(2)-多段音频顺序播放的设置
  • 使用python爬虫语言调用有道翻译实现英中互译(2023实现)
  • 2024王道考研计算机组成原理——指令系统
  • vscode中如何将cmd设置为默认终端
  • Unity UGUI 循环滑动列表实现思路及简单代码实现
  • 贪心算法(1)--经典贪心算法
  • Nginx负载均衡和备份和故障转移
  • Android-Framework 三方应用默认权限都不弹窗
  • TX Text Control.NET For WPF 32.0 Crack
  • 使用Go语言测试Redis性能
  • 【Javascript】运算符(赋值,算术,自增,自减)
  • Redis数据类型——list类型数据的扩展操作
  • [论文笔记]NEZHA
  • 【Linux】认识协议
  • Hadoop3教程(三十四):(生产调优篇)MapReduce生产经验汇总
  • Unity⭐️Win和Mac安卓打包环境配置
  • STM32F4XX之串口
  • 【J-Long Group Limited】申请1500万美元纳斯达克IPO上市
  • 上传文件到google drive
  • 用VLOOKUP快速合并两个表格
  • Vue ref属性
  • 【python入门】函数,类和对象