当前位置: 首页 > news >正文

【SD】 Stable Diffusion(SD)原理详解与ComfyUI使用 2

Stable Diffusion(SD)原理详解与ComfyUI使用

      • Stable Diffusion(SD)原理详解与ComfyUI使用
        • 1. SD整体结构
        • 2. Clip(文本编码器)
        • 3. Unit(生成模型)
        • 4. VAE(变分自编码器)
        • 5. 整体工作流程
        • 6. ComfyUI低显存生成图片
        • 7. 总结

Stable Diffusion(SD)原理详解与ComfyUI使用

在这里插入图片描述

1. SD整体结构
  • 输入:文本和随机变量(Latent Vector)
  • 输出:图片
  • 核心:由三个模型组成
    1. 文本编码器(Clip)
    2. 生成模型(Unit)
    3. 变分自编码器(VAE)
2. Clip(文本编码器)
  • 专为SD设计的文本编码器
  • 训练步骤:
    1. 有限制性预训练:使用图片和文本描述的数据集,训练文本编码器和图片编码器,使输出向量尽可能接近。
    2. 进一步训练:使用物体名称和描述,训练文本编码器解码能力。
3. Unit(生成模型)
  • 功能:加噪和降噪过程
  • 过程:将图片经过VAE编码器处理,生成与Latent Vector相同大小的图片,然后通过加噪和降噪生成中间结果。
4. VAE(变分自编码器)
  • 功能:降维和升维
  • 过程:
    1. 编码器将图片转换为较小的表示
    2. 解码器将较小的表示还原为原图大小
  • 优点:无需标签,可以从噪声中生成图片
5. 整体工作流程
  1. 文本通过Clip编码成向量
  2. 向量和Latent Vector一起输入到Unit
  3. Unit进行降噪处理,生成中间结果
  4. 中间结果通过VAE解码器还原为最终图片
6. ComfyUI低显存生成图片
  • 利用SD原理,ComfyUI可以在低显存条件下生成高质量图片
  • 通过理解SD的各个部件和工作流程,可以更好地使用ComfyUI
7. 总结
  • SD通过结合文本编码器、生成模型和变分自编码器,实现了从文本到图片的生成
  • ComfyUI利用SD原理,提供了一种在资源受限条件下生成图片的方法
  • 理解SD的架构和组件对于有效使用ComfyUI至关重要
http://www.lryc.cn/news/404771.html

相关文章:

  • 【学习笔记】无人机系统(UAS)的连接、识别和跟踪(七)-广播远程识别码(Broadcast Remote ID)
  • VMware 虚拟机 ping 不通原因排查
  • websocket状态机
  • JCR一区级 | Matlab实现CPO-Transformer-LSTM多变量回归预测【2024新算法】
  • 力扣3226 使两个整数相等的位更改次数
  • VLAN 划分案例详解
  • [技术总结] C++ 使用经验
  • 音频数据集
  • Java | Leetcode Java题解之第268题丢失的数字
  • 指针!!C语言(第二篇)
  • AIGC-ToonCrafter: Generative Cartoon Interpolation
  • 牛奶供应(三)
  • 首批通过 | 百度通过中国信通院H5端人脸识别安全能力评估工作
  • JVM---对象是否存活及被引用的状态
  • 科研绘图系列:R语言分割小提琴图(Split-violin)
  • WEB前端09-前端服务器搭建(Node.js/nvm/npm)
  • ASP.NET Core在启动过程中使用数据库实例的几种方式
  • AndroidStudio 编辑xml布局文件卡死问题解决
  • 使用 PVE 自签 CA 证书签发新证书
  • ubuntu 22.04安装Eigen
  • vue使用audio 音频实现播放与关闭(可用于收到消息给提示音效)
  • STM32 产生Hard Fault 调试方法
  • java-selenium 截取界面验证码图片并对图片文本进行识别
  • 【Linux】进程信号 --- 信号产生
  • Docker 容器中的 Docker Compose 简介
  • 手机日历如何与Outlook同步
  • python基础语法 007 文件操作-1读取写入
  • C语言·函数(超详细系列·全面总结)
  • Windows及Linux系统加固
  • Postman安装使用教程(详解)