当前位置: 首页 > news >正文

comfyUI-ControlNet-姿势控制深度控制

一个较免费的获取大量高质量真实人物素材的网站

发现并下载免费图片 - Pixabay

1.基础工作流

最基本的5个节点:Checkpoint、CLIP、K采样器、VAE解码、空Latent

2.加载ControlNet节点

openppse主要控制人物骨骼和面部表情

此处同样使用到webUI中使用过的DWpose:SD-细节控制-CSDN博客

在webUI中使用效果 

加载openpose类型的ControlNet模型,实现姿势的融合。

 

3.图像姿态处理-openpose

如果图片分辨率过高,可以取消获取原图大小节点的使用,将已经转换为输入的宽高度,重新转换为组件,自行输入数据 。

 下图就是由于lz原有图片分辨率过高,导致生成图片出现异常

使用DW姿态预处理器节点。从图像中提取人体姿态关键点(骨骼关节点) 

 BBox(边界框)检测中的模型为均为目标检测模型(Object Detection Models),专门用于在图像中识别并定位物体(如人体、车辆等),生成边界框(Bounding Box,简称BBox)。

文件格式后缀说明 

文件后缀运行环境优势
.onnx通用 (ONNX Runtime)兼容性强,跨平台
.torchscript.ptPyTorch专属与Torch生态无缝集成
_fp16.onnx支持FP16的硬件显存减半,速度提升20%

姿态预估处

建议使用dw-ll_ucoco_384_bs5.torchscript。

在更改图片分辨率,将生成图片的分辨率改为模型训练时的分辨率后,图像即能参考原图姿势实现风格的转绘。如果提示词过多。可能会导致动作参考不够准确,可以通过修改ControlNet中的强度提升生图对姿态的参考。

 

 4.景深-depth

通过获取原始图片画面中各独立要素与照相机之间的距离关系,和openpose的节点布局一致,只需要将ControlNet加载的模型更换为depth类型的模型,同时使用Zoe深度预处理器对参考图片进行处理即可。

由于更换场景类图片并修改提示词后,生成的图片效果会比原来好很多。

 

 图左图为经过Zoe处理过后的黑白图,图中越亮的部分代表该部分离摄像机越近,该方法适合运用在对场景建筑的风格进行转换上。

完整工作流:ControlNet-openpose+depth | ComfyUI Workflow | 吐司 tusiart.com

comfyUI-controlNet-线稿&软边缘-CSDN博客

summary

目前已经使用过controlNet中的

lineart——线稿提取,softedge——软边缘,openpose——人物姿态提取,depth——景深

控制类型代表模型最佳应用场景
Lineart(线稿提取)control_v11p_sd15_lineart1. 黑白漫画上色
2. 草图转精细插画
3. 分镜稿批量生成
SoftEdge(软边缘)control_v11p_sd15_softedge1. 水彩/油画风格
2. 毛绒材质渲染
3. 朦胧氛围场景
OpenPose(姿态提取)control_v11p_sd15_openpose1. 角色动作迁移
2. 多人互动场景
3. 动态分镜设计
Depth(景深)control_v11f1p_sd15_depth1. 场景层次构建
2. 焦点虚化特效
3. 2.5D伪三维创作

各个节点的工作流的搭建方法大致相同。

模型之间的匹配真的很伤脑,lz考虑整理模型关系了。。。

http://www.lryc.cn/news/587235.html

相关文章:

  • Java 8 LocalDate 日期操作全攻略
  • CS课程项目设计1:交互友好的井字棋游戏
  • 【多线程】 线程池设多大才合理?CPU 密集型和 I/O 密集型的终极公式
  • 深度学习图像分类数据集—七种树叶识别分类
  • AI生成单词消消乐游戏. HTML代码
  • LeetCode 2401.最长优雅子数组
  • Ampace厦门新能安科技Verify 测评演绎数字推理及四色测评考点分析、SHL真题题库
  • 【sql学习之拉链表】
  • 系规备考论文:论IT服务知识管理
  • MyBatis框架进阶指南:深入理解CRUD与参数映射
  • CVE-2022-0609
  • Oracle SQL - 使用行转列PIVOT减少表重复扫描(实例)
  • 常用的docker命令备份
  • Docker从环境配置到应用上云的极简路径
  • 《Google 软件工程》:如何写好文档?
  • Qt窗口:QToolBar、QStatusBar、QDockWidget、QDialog
  • QT 多线程 管理串口
  • Vue框架之计算属性与侦听器详解
  • 深入理解 LangChain:AI 应用开发的全新范式
  • openEuler欧拉系统重置密码
  • 标注识别 自己的数据集20张 roboflow 实例分割
  • 基于requests_html的爬虫实战
  • 【DVWA系列】——File Upload——low详细教程(webshell工具冰蝎)
  • Vue Router 完全指南:从入门到实战,高效管理前端路由
  • 12.I/O复用
  • 光盘处理难题不用愁,DVDFab 来救场
  • 博客项目 laravel vue mysql 第五章 标签功能
  • 从 Intel MacBook 迁移到 ARM MacBook 的完整指南
  • 【牛客刷题】四个选项:高考选择题方案统计(并查集+动态规划)
  • 【基于开源大模型(如deepseek)开发应用及其发展趋势的一点思考】