当前位置: 首页 > news >正文

4、stable diffusion

github

安装anaconda环境

conda env create -f environment.yaml
conda activate ldm

安装依赖

conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
pip install transformers==4.19.2 diffusers invisible-watermark
pip install -e .

安装xformers加速
xformers安装包
找到符合自己python,pytorch和cuda版本的xformers安装包
在这里插入图片描述

wget https://anaconda.org/xformers/xformers/0.0.16/download/linux-64/xformers-0.0.16-py39_cu11.3_pyt1.12.1.tar.bz2
conda install xformers-0.0.16-py310_cu11.3_pyt1.12.1.tar.bz2
python -m xformers.info

安装成功为下述图片
在这里插入图片描述

下载预训练模型权重
文生图
SD2.1-v
Image Inpainting with Stable Diffusion
512-inpainting-ema.ckpt

从Hugging Face下载encoding
当我们运行scripts/txt2img.py时,会发现还需要从hugging face下载encoding,但是国内无法下载,这时候我们会科学上网,同时安装下述依赖,这样就可以下载了

os.environ["http_proxy"] = "http://ip:7890"
os.environ["https_proxy"] = "https://ip:7890"pip install urllib3==1.25.11
pip install requests==2.27.1

在这里插入图片描述

文生图

python scripts/txt2img.py 
--prompt
"a professional photograph of an astronaut riding a horse"
--ckpt
/devdata/chengan/stablediffusion/v2-1_768-ema-pruned.ckpt
--config
configs/stable-diffusion/v2-inference-v.yaml
--H
768
--W
768
--device 
cuda

注意: --device 默认为cpu,要换成 cuda,否则报错

RuntimeError: expected scalar type BFloat16 but found Float

在这里插入图片描述
在这里插入图片描述

图生图

python scripts/gradio/inpainting.py configs/stable-diffusion/v2-inpainting-inference.yaml /devdata/chengan/stablediffusion/512-inpainting-ema.ckpt
http://www.lryc.cn/news/247921.html

相关文章:

  • LeetCode51. N-Queens
  • 前端vue3——html2canvas给网站截图生成宣传海报
  • C语言实现串的部分算法
  • UE5、CesiumForUnreal实现加载GeoJson绘制多面(MultiPolygon)功能(支持点选高亮)
  • pandas教程:USDA Food Database USDA食品数据库
  • 0基础学习VR全景平台篇第122篇:VR视频剪辑和输出 - PR软件教程
  • ucharts中,当数据为0时,不显示
  • React函数组件渲染两次
  • 人工智能 - 图像分类:发展历史、技术全解与实战
  • go标准库
  • 【Web安全】拿到phpMyAdmin如何获取权限
  • Python与GPU编程快速入门(一)
  • C语言--每日选择题--Day29
  • ESP32:物联网时代的神器
  • docker和docker-compose生产的容器,不在同一个网段,解决方式
  • 基于JavaWeb+SSM+Vue校园综合服务小程序系统的设计和实现
  • 私域运营:资源盘点及争取策略
  • 图书管理系统源码,图书管理系统开发,图书借阅系统源码整体功能演示
  • (C++)字符串相乘
  • 1992-2021年区县经过矫正的夜间灯光数据(GNLD、VIIRS)
  • RK3568笔记六:基于Yolov8的训练及部署
  • 【活动回顾】sCrypt在柏林B2029开发者周
  • 【SpringBoot3+Vue3】六【完】【番外篇】- (0-1临摹)
  • 生成式AI与大语言模型,东软已经准备就绪
  • Python爬虫遇到重定向URL问题时如何解决?
  • 【点云surface】无序点云快速三角化
  • el-select多选下拉框实现全选功能
  • Elasticsearch 聚合查询(Aggregation)详解
  • 数据库其它调优策略
  • 【AI认证笔记】NO.2人工智能的发展