让AI绘图更可控!ComfyUI-Cosmos-Predict2基础使用指南
Cosmos-Predict2 是由 NVIDIA 推出的新一代物理世界基础模型,专为物理 AI 场景下的高质量视觉生成与预测任务设计。 该模型具备极高的物理准确性、环境交互性和细节还原能力,能够真实模拟复杂的物理现象与动态场景。 Cosmos-Predict2 支持文本到图像(Text2Image)和视频到世界(Video2World)等多种生成方式,广泛应用于工业仿真、自动驾驶、城市规划、科学研究等领域,是推动智能视觉与物理世界深度融合的重要基础工具。
使用流程
经平台工程师构建后,已经在 ComfyUI 中创建了 Cosmos-Predict2 两个工作流,只需启动即可点击选择使用,并且也在插件管理器中安装了几个常用的插件,如果想使用其他插件,请自行下载。
UI 界面
1.使用 Cosmos-Predict2的文本到图像工作流
- 在 UI 界面点击文件图标选择文生图工作流
- 根据下面的顺序依次操作
在上面红框的1、2处填写正反向提示词,绿色的为正向提示词,紫色的为反向提示词。可以根据自己的要求更改参数。
如果出现模型路径问题,可点击3、4、5处切换模型路径
注意:提示词要使用英文
2.使用 Cosmos-Predict2 的图像编辑工作流
- 在 UI 界面点击文件图标选择图生视频工作流
- 根据下面的顺序依次操作
填写提示词,上传图片即可点击运行
注意:如果需要首尾帧控制,可以使用快捷键 Ctrl(cmd) + B
来启用尾帧输入