当前位置: 首页 > news >正文

stable-zero123模型构建指南

一、介绍

image.png

stabilityai出品,能够对有简单背景的物体进行三维视角图片的生成,简单来说也就是通过调整变换观察的视角生成对应视角的图片。

本项目通过comfyui实现。

二、容器构建说明

1. 部署ComfyUI

(1)使用命令克隆ComfyUI

git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

(2)安装 conda(如已安装则跳过)

下面需要使用 Anaconda 或 Mimiconda 创建虚拟环境,可以输入 conda --version 进行检查。下面是 Mimiconda 的安装过程:

  • 下载 Miniconda 安装脚本
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
  • 运行安装脚本
bash Miniconda3-latest-Linux-x86_64.sh
  • 遵循安装提示并初始化

按 Enter 键查看许可证条款,阅读完毕后输入 yes 接受条款,安装完成后,脚本会询问是否初始化 conda 环境,输入 yes 并按 Enter 键。

  • 运行 source ~/.bashrc 命令激活 conda 环境
  • 再次输入 conda --version 命令来验证是否安装成功,如果出现类似 conda 4.10.3 这样的输出就成功了。

(3)创建虚拟环境

输入下面的命令:

conda create -n comfyui python=3.10
conda activate comfyui

(4)安装pytorch

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121

(5)安装项目依赖

pip install -r requirements.txt

此时所需环境就已经搭建完成,通过下面命令进行启动:

python main.py

访问网址得到类似下图界面即表示成功启动:

image.png

2. 下载zero123模型

(1)下载模型

访问 Hugging Face 搜索“stabilityai/stable-zero123”下载模型。首次访问该页面时,可能需要同意用户协议才能看到模型下载页。

模型:

image.png

将模型下载到 ComfyUI/models/checkpoint

(2)下载工作流

进入“3D 示例 |ComfyUI_examples (comfyanonymous.github.io)”需下载图中包含工作流的图片,放置到/comfyui_workflow文件中。

image.png

重新启动模型将工作流导入即可:

image.png

3. 拓展插件安装(可选)

(1)下载manager管理器

manager 是一个用来加强ComfyUI可用性的扩展,提供了对ComfyUI各种自定义节点的安装、删除、禁用、启用等管理功能。同时还提供了中心功能和便利功能,用来访问 ComfyUI 中各种信息。

cd /ComfyUI/custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager.git

成功安装之后重启界面会出现一个“Manager”如图:

image.png

(2)界面汉化插件
git clone https://github.com/AIGODLIKE/AIGODLIKE-ComfyUI-Translation.git

下载文件之后需要重新启动,重启模型之后:

image.png

设置一次之后可点击图中框选出的选项进行语言的切换:

image.png

(3)中文提示词插件安装
cd /ComfyUI/custom_nodes
git clone https://github.com/thisjam/comfyui-sixgod_prompt.git

然后重启ComfyUI后看到下图的小标志就表示可以了:

image.png

使用方法:双击页面,在搜索框中搜索“six”即可出现,点击sixGodPrompts,此时出现的就是提示词的中文输入框可以替代自带的clip输入框,可点击左下角的小标或按“AIT”+“q”打开和隐藏。

image.png

使用方法如下:

image.png

http://www.lryc.cn/news/469994.html

相关文章:

  • 算法题解记录32+++最长连续序列(百题筑基)
  • 全球知名度最高的华人起名大师颜廷利:世界顶级思想哲学教育家
  • Flink Rest API
  • Zig 语言通用代码生成器:逻辑,冒烟测试版发布二
  • mysql 通过GROUP BY 聚合并且拼接去重另个字段
  • Java应用程序的测试覆盖率之设计与实现(一)-- 总体设计
  • Unity C#脚本的热更新
  • 监督学习之逻辑回归
  • 深度优先算法(DFS)洛谷P1683-入门
  • Python数据分析基础
  • 《企业自设2-软件测试》线下课day3: 006扩展虚拟机
  • 配置和排查 Lombok 在 IDEA 中使用的详细步骤
  • JavaWeb合集18-接口管理Swager
  • 背包九讲——二维费用背包问题
  • 【mysql进阶】4-7. 通用表空间
  • 2024 年互联网大厂 1300 多道 JAVA 面试题汇总,包含了程序员的所有技术点
  • 【开源免费】基于SpringBoot+Vue.JS在线文档管理系统(JAVA毕业设计)
  • Linux资源与网络请求
  • RPA技术重塑企业自动化的未来
  • 使用RabbitMQ实现延迟消息的完整指南
  • 阿里员工:阿里工作7年至少得P7吧,快的都P8了,年薪100W是正常的,80才算及格...
  • Django进一步掌握(10月22日)
  • C++从入门到起飞之——红黑树封装map和set 全方位剖析!
  • 【javax maven项目缺少_Maven的依赖管理 引入依赖】
  • 手搓一个定时器
  • AI提示词工程优化Prompt-GPT使用手册(科普一键收藏史上最强攻略)
  • 【数据结构】快速排序(三种实现方式)
  • 利用前向勾子获取神经网络中间层的输出并将其进行保存(示例详解)
  • CTF-RE 从0到N: S盒
  • MT-Pref数据集:包含18种语言的18k实例,涵盖多个领域。实验表明它能有效提升Tower模型在WMT23和FLORES基准测试中的翻译质量。