当前位置: 首页 > news >正文

Stable Diffusion AI绘画学习指南【常用模型,采样器介绍】

常用采样器、目前有20个采样步骤越多每个步之间的降噪越小,减少采样过程中的截断误差,结果越好

学微分方程求解器

Euler(最简单的采样器,采样过程中不加随机噪声,根据采样计划来执行每个步骤中的噪声,并使用欧拉方法减少适当数量的噪声以适应噪声计划,到最后一步为 0)、Heun(是对 Euler 的更精确的改进,但需要在每个步骤中预算两次噪声,处理速度相对会更慢一些)、LMS(解决学微分方程的标准方法,采样速度与 Euler 相同)
祖先采样器.

随机采样,采样过程具一定的随机性,缺点是图像不收敛

Euler a(在每个步骤中减去比『应该』更多的噪声并添加一些随机的噪声以接近于噪声计划,去噪图像取决于前面步骤添加的特定噪声)、DPM2 a、DPM++2s a、DPM2 a Karras、DPM++ 2S a Karras

官方采样器,最早的采样器算法

DDIM、(使用去噪后的图像来近似最终图像,并使用噪声预测估计的噪声来近似图像方向)PLMS  (是 DDIM 的新版且更快速的替代品)DPM 和 DPM++,DPM2(是 katherine Crowson 在 k-diffusion 项目中自创的,灵感来源 DPM-Solever-2 和算法 2,受采样器设置中的 sigma 参数影响) 、DPM2  a(祖先采样器的一种,受采样器的 ETA 参数影响)、DPM++ 2s a(祖先采样器的一种,受采样器的 ETA 参数影响) 、DPM++ SDE(受采样器的 ETA 参数影响)、DPM fast (用于 steps 小于 20 的情况,受采样器的 ETA 参数影响 )、DPM++ 2M(在速度和质量的平衡最好,代表 m 的多步比上面的 s 单步在采样时会参考更多步,而非当前步所以能有更好的质量)、DPM adaptive (2022 年发布的扩散模型的新采样器,DPM2 比 DPM 更准确但速度较慢,DPM++是对 DPM 的改进,可以自适应的调整步长,但会很慢,不能保证在规定的采样步骤内完成.)

带有 Karras 字样的采样器

使用了噪声时间表,控制每个步骤的噪声水平,随着采样步骤的增加,减少了截断误差

UNiPC

是 2023 年发布的,目前最快速的最新的采样方法 UNiPC sampling steps 10、UNiPC sampling steps 20、UNiPC sampling steps 30受 ODE 求解器中预测校正方法启发 可以在很少的步骤就可以实现高质量图像生成

常用的采样器

DPM++ 2M karras(20-30 步)、unpic(15-25 步)、如果想要高质量的图,不收敛可以选择 DPM++ SED Karras,DDIM (10-15 步,较快) ,如果要简单的图可以选 Euler,heun 可以减少步骤以节省时间,如果想要稳定可复线的图(Euler a、DPM2 a、DPM++ 2s a、DPM2 a karras、DPM2 ++ 2s a karras,避免采用任何祖先采样器)

常用模型

二次元代表:Anything v5、Counterfeit v2.5、Dreamlike Diffusion、

标签与风格关键词:

illustration,painting,sketch,drawing,painting,comic,anime,catoon 

可以使用这些词语为关键词搜索对应的风格模型,也可以使用它们在 Prompt 中激活模型风格特性。

写实代表:Deliberate、Realistic Vision、LOFI(L.O.F.I)

标签与风格关键词:

photography,photo,realistic,photorealistic,RAW photo 

可以使用这些词语为关键词搜索对应的风格模型,也可以使用它们在 Prompt 中激活模型风格特性。

2.5D 风代表:NeverEnding Dream(NED)、Protogen (Realistic) 、国风 V3(GuoFeng3) 、lora 卡通证件照(底模:DreamShaper,06-0.9)

风格关键词:

3D、render、chibi、digital art、concept art、{realistic}

可以使用这些词语为关键词搜索对应的风格模型,也可以使用它们在 Prompt 中激活模型风格特性。

模型扩展名的区分

模型的类型(是装着各种图片的容器)官方模型网站:https://huggingface.co

Stable Diffusion 大模型(*.ckpt) 文件是用 pickle 序例化的。这意味着它有可能会包含恶意代码。加载这类型的模型应该确认可靠的来源。

*.safetensors 文件是用 numpy 保存的,这意味着它们只是包含张量数据。没有任何代码。加载*.safetensors 文件更安全快捷。

emb 模型 嵌入式模型是一种用于生成图片语言理解组件,它可以接受文本提示并产生 token embeddings,模型有多种不同的训练方法,例如 Textual Inversion,Hypernetwork,Dreambooth 和 LoRA,这几种各有优劣势和应用场景。

VAE 模型,具有颜色的校正功能,可以让生成的图像更加鲜艳或者柔和,初化的图像,可能在这个图像的基础上进行细化和改进。低维的隐空间,可以在这个空间中控制图像的风格和特征。

超网络模型(hypernetworks) 可以用来对 Stable-diffusion 的模型进行风格迁移(style transfer)。

LoRA  模型 体积小,适合性能不足的电脑使用,可以用少量的图片训练,训练时间较短,一般用于固定的人物,服装,动作。

模型的安装

官方模型网站 https://huggingface.co

将下载的模型文件放入 stable-diffusion-webui/models/下对应模型类型的文件目录中,在 web UI 的模型选择后面重载,即可看到新加入的模型,models 目录下包含模型,算法,采样器。

http://www.lryc.cn/news/108588.html

相关文章:

  • pycharm——漏斗图
  • RISC-V基础之浮点指令(包含实例)
  • 前端生成图片验证码怎么做?
  • 【Java】springboot框架 粮油质量溯源MES生产加工管理系统源码
  • macOS install redis遇到的bug(tar包,homebrew安装,守护进程redis.conf配置)
  • 面试题:创建JS对象的几种方式?构造函数是什么?new操作符具体干了什么?为什么字符串可以使用length?
  • LabVIEW深度相机与三维定位实战(下)
  • 【基础类】—CSS盒模型的全面认识
  • ATFX汇评:非农就业报告来袭,汇市或迎剧烈波动
  • SpringBoot的常用注解的服用方式
  • [课程][原创]CMakeLists编写实战linux版
  • 静态路由下一跳地址怎么确定(静态路由配置及讲解)
  • SPSS‖参数与非参数检验对比课程中的 配对样本T检验
  • AI赋能转型升级 助力打造“数智辽宁”——首次大模型研讨沙龙在沈成功举行
  • JVM、Redis、反射
  • 【Spring练习项目】博客系统
  • 神策新一代分析引擎架构演进
  • Systemui的介绍以及与普通应用的差异
  • 群狼调研—产业园物业满意度的调研对象
  • 想参加华为杯竞赛、高教社杯和数学建模国赛的小伙伴看过来
  • ELK 企业级日志分析系统
  • PyTorch Lightning教程六:优化代码
  • 基于linux下的高并发服务器开发(第四章)- 多线程实现并发服务器
  • YUV 色彩空间中U 和 V 分量的范围
  • 【云原生】K8S二进制搭建一
  • 自动化应用杂志自动化应用杂志社自动化应用编辑部2023年第11期目录
  • Tensorflow2-初识
  • idea-常用插件汇总
  • 【Kubernetes】
  • 使用逗号方式、JOIN方式和USING方式进行多表连接查询时哪个方式更好