当前位置: 首页 > news >正文

Diffusion Model Stable Diffusion(笔记)

参考资料:

文章目录

  • DDPM架构
  • 模型如何拥有产生逼真图片的能力
    • Denoise模型功能
    • Denoise模型如何训练
    • 考虑进文字
  • 文生图流程(Stable Diffusion)

DDPM架构

在这里插入图片描述

模型如何拥有产生逼真图片的能力

Denoise模型功能

通过Denoise将一个噪音图一步步生成为目标图像
在这里插入图片描述
Denoise实际功能是通过一个图x+时间戳,生成该图中噪音点y,然后用原图x-y得到去掉噪音点的图
在这里插入图片描述

Denoise模型如何训练

Denoise模型的能力是根据图x和时间戳,识别x中的噪音点。那么训练就是反过来
x(原图)+噪音y(随机高斯分布得到)=噪音图z
现在将z和时间戳作为数据,然后将噪音y作为标准答案,然后巡训练模型
在这里插入图片描述

考虑进文字

就是输入的时候多输入一个文字信息,训练的时候也是多输入一个文字信息
在这里插入图片描述

在这里插入图片描述

文生图流程(Stable Diffusion)

在这里插入图片描述

http://www.lryc.cn/news/443346.html

相关文章:

  • 如何创建模板提示prompt
  • C语言 | Leetcode C语言题解之第423题从英文中重建数字
  • Jboss CVE-2017-12149 靶场攻略
  • ROS2 中令人困惑的rclpy.shutdown()
  • PHP纯离线搭建(php 8.1.7)
  • 【iOS】push和pop、present和dismiss
  • 基于51单片机的两路电压检测(ADC0808)
  • JavaScript ---案例(统计字符出现次数)
  • 切换淘宝最新npm镜像源
  • mysql时间戳格式化yyyy-mm-dd
  • 网络丢包定位记录(二)
  • 深度学习自编码器 - 自编码器的应用篇
  • Python 小工具制作 系列文章 - 总目录
  • Codeforces Round 973 (Div. 2) - D题
  • threejs性能优化之gltf文件压缩threejs性能优化之glb文件压缩
  • 设计模式 享元模式(Flyweight Pattern)
  • Leetcode 3290. Maximum Multiplication Score
  • CefSharp_Vue交互(Element UI)_WinFormWeb应用(3)---通过页面锁屏和关机(含示例代码)
  • unity UnityWebRequest 的request.downloadHandler 空应用
  • 使用 UWA Gears 定位游戏内存问题
  • OpenRestry(一个Nginx集成工具)的安装与使用
  • linux操作系统的基本命令
  • 通过UV快速计算品牌独立站网络流量
  • 使用Kong开源API网关的保姆级教程
  • 浅谈Spring Cloud:认识微服务
  • mac命令行分卷压缩与合并
  • 在 Linux (aarch64) 编译 OpenJDK 8
  • 如何有效检测住宅IP真伪?
  • springboot acuturator
  • 什么是SaaS软件?有哪些常用的SaaS软件?