当前位置: 首页 > news >正文

autodl+modelscope推理stable-diffusion-3.5-large

本篇介绍如何在服务器上实现SD3.5模型的加载及推理,不包含训练及微调。

磁盘扩容

autodl服务器在关机状态下,进行扩容:
在这里插入图片描述

选择要扩容的大小(比如我这里已经扩了80G,默认有50G免费的),就会有一个计费出来:
在这里插入图片描述
扩容完成后配置开机就会自动生效,类似地也可以选择“升级配置”扩卡(如果有需要的话)。

下载模型

下载模型这里,折腾了挺久,还是选择国内源最便捷。魔塔社区有点像HF的意思。
可以使用SDK,或者git clone,也可以选择使用modelscope命令下载(建议用1、3方式下载,可以断点续传)

# 安装modelscope
pip install modelscope# 下载repo到指定路径
modelscope download --model AI-ModelScope/stable-diffusion-3.5-large --local_dir ./stable-diffusion-3.5-large

默认下载到系统盘路径/root/.cache/modelscope/hub/AI-ModelScope/stable-diffusion-3.5-large,这里需要指定到数据盘路径(虽然它的日志给出了误导人的提示)。

开始推理

使用离线模型文件,修改后的推理脚本:

import torch
from diffusers import StableDiffusion3Pipelinemodel_path = "stable-diffusion-3.5-large"
pipe = StableDiffusion3Pipeline.from_pretrained(model_path, torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()image = pipe(prompt="a photo of a cat holding a sign that says hello world",negative_prompt="",num_inference_steps=40,height=1024,width=1024,guidance_scale=4.5,
).images[0]image.save("sd3_hello_world-1.png")

有一个问题是官方给的代码是使用pipe.to("cuda")全让GPU干了,但是实测下来一块4090依然扛不住,所以改为代码里的pipe.enable_model_cpu_offload()让CPU也一起来分担。这样就可以完美完成推理。

系统监控(非必须)

安装监控所需要的包:

apt install net-tools
apt install vnstat
apt install sysstat

sar -n DEV 5 10:每5s执行一次,一共执行十次

root@autodl-container-da9843af01-9a6b176e:~/autodl-tmp/stable-diffusion-3.5-large# sar -n DEV 5 10
Linux 5.15.0-94-generic (autodl-container-da9843af01-9a6b176e) 	11/12/24 	_x86_64_  (192 CPU)06:43:45        IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s   %ifutil
06:43:50           lo      0.80      0.80      0.07      0.07      0.00      0.00      0.00      0.00
06:43:50         eth0  13095.20   5037.80  24062.36    443.36      0.00      0.00      0.00      1.9706:43:50        IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s   %ifutil
06:43:55           lo      0.40      0.40      0.13      0.13      0.00      0.00      0.00      0.00
06:43:55         eth0  13445.51   4715.57  24038.59    419.16      0.00      0.00      0.00      1.97

我这里只是想测一下实际下载过程中的网络情况。
当然autodl也提供了监控选项:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

拓展资料:modelscope 的使用手册

http://www.lryc.cn/news/483262.html

相关文章:

  • 深度学习之 LSTM
  • LeetCode 3242.设计相邻元素求和服务:哈希表
  • 【AliCloud】ack + ack-secret-manager + kms 敏感数据安全存储
  • 探索JavaScript的强大功能:从基础到高级应用
  • 新增支持Elasticsearch数据源,支持自定义在线地图风格,DataEase开源BI工具v2.10.2 LTS发布
  • Spark的容错机制
  • YOLOv8改进 | 利用YOLOv8进行视频划定区域目标统计计数
  • 基于yolov8、yolov5的番茄成熟度检测识别系统(含UI界面、训练好的模型、Python代码、数据集)
  • wafw00f源码详细解析
  • 什么是crm?3000字详细解析
  • WEB3.0介绍
  • 【深度学习】LSTM、BiLSTM详解
  • 分子对接--软件安装
  • 【Python无敌】在 QGIS 中使用 Python
  • 全面解读:低代码开发平台的必备要素——系统策划篇
  • Vue开发自动生成验证码功能 前端实现不使用第三方插件实现随机验证码功能,生成的验证码添加干扰因素
  • # filezilla连接 虚拟机ubuntu系统出错“尝试连接 ECONNREFUSED - 连接被服务器拒绝, 失败,无法连接服务器”解决方案
  • 2024/11/13 英语每日一段
  • 【全栈开发平台】全面解析 StackBlitz 最新力作 Bolt.new:AI 驱动的全栈开发平台
  • 文献解读-DNAscope: High accuracy small variant calling using machine learning
  • 成都睿明智科技有限公司解锁抖音电商新玩法
  • 【操作系统】——调度算法
  • MySQL LOAD DATA INFILE导入数据报错
  • AI 写作(五)核心技术之文本摘要:分类与应用(5/10)
  • CTFL(二)贯穿软件开发生存周期中的测试
  • PMIC FS8405
  • matlab建模入门指导
  • 微搭低代码入门03函数
  • 零基础Java第十六期:抽象类接口(二)
  • 【css】html里面的图片宽度设为百分比,高度要与宽度一样