当前位置: 首页 > news >正文

【Stable Diffusion部署至GNU/Linux】安装流程

以下是安装Stable Diffusion的步骤,以Ubuntu 22.04 LTS为例子。

显卡与计算架构介绍

CUDA是NVIDIA GPU的专用并行计算架构
技术层级说明
CUDA Toolkit提供GPU编译器(nvcc)、数学库(cuBLAS)等开发工具
cuDNN深度神经网络加速库(需单独下载)
GPU驱动包含CUDA Driver(需与CUDA Toolkit版本匹配)

CUDA与NIDIA

  1. 硬件指令集绑定:NVIDIA GPU内置CUDA核心需要专用指令集
  2. 生态垄断地位:90%的深度学习框架原生支持CUDA(PyTorch/TensorFlow等)
  3. 计算库优化:cuBLAS/cuDNN等加速库针对N卡有极致优化

可以把英伟达的驱动和CUDA的关系类比为Python解释器和Python语言。具体来说:
英伟达驱动(NVIDIA Driver):这个类似于Python解释器。它是底层的软件,负责与硬件(即GPU)进行通信。英伟达驱动提供了基本的功能和接口,使得操作系统和其他软件能够使用GPU进行各种计算任务。

CUDA(Compute Unified Device Architecture):这个类似于Python语言。CUDA是一个并行计算平台和编程模型,它允许开发人员使用C、C++和Fortran等高级编程语言编写能够在英伟达GPU上运行的程序。CUDA依赖于英伟达驱动来访问和控制GPU硬件资源。


AMD显卡:ROCm

ROCm:AMD的开放计算平台(Radeon Open Compute)

对应组件功能
ROCm Toolkit包含编译器(HIPCC)、数学库(rocBLAS)等
MIOpen深度学习加速库(对标cuDNN)
ROCm DriverAMD GPU内核级驱动

关键对比(NVIDIA CUDA vs AMD ROCm)

特性NVIDIA CUDAAMD ROCm
启动时间2006年2016年
硬件兼容性全系N卡仅RX Vega及更新架构
容器支持完善的NGC Docker镜像有限支持
主流框架覆盖率100%约70%
典型延迟优化纳秒级微秒级

安装流程

1. 检查NVIDIA驱动及CUDA(NVIDIA显卡用户)

  • 安装专有NVIDIA驱动,之后重开机。
  • 安装 CUDA
  • 命令
    nvidia-smi       # 检查NVIDIA驱动状态
    nvcc --version   # 检查CUDA版本
    
  • 作用:确认GPU驱动和CUDA环境正常。
  • 问题处理
    • 若命令未找到:需安装NVIDIA驱动和CUDA。
    • 版本不兼容:确保CUDA版本与PyTorch兼容(如CUDA 11.x/12.x)。

2. 安装AMD驱动及ROCm(AMD显卡用户)

AMD显卡知识库
在 Ubuntu 系统上安装和配置 AMD GPU 驱动及 ROCm(Radeon Open Compute)平台


1. 安装内核头文件和额外模块
sudo apt install linux-headers-`uname -r	
http://www.lryc.cn/news/536448.html

相关文章:

  • 【C/C++算法】从浅到深学习---滑动窗口(图文兼备 + 源码详解)
  • 计算机毕业设计SpringBoot+Vue.js房源推荐系统 房价预测 房源大数据分析可视化(源码+文档+运行视频+讲解视频)
  • 开源机器人+具身智能 解决方案+AI
  • 通过 VBA 在 Excel 中自动提取拼音首字母
  • 华硕笔记本怎么一键恢复出厂系统_华硕笔记本一键恢复出厂系统教程
  • Ubuntu 如何安装Snipaste截图软件
  • 【离散数学上机】T235,T236
  • 【Android开发】安卓手机APP使用机器学习进行QR二维码识别(完整工程资料源码)
  • 【油猴脚本/Tampermonkey】DeepSeek 服务器繁忙无限重试(20250214优化)
  • 为deepseek搭建本地页面
  • 详解df -h命令
  • 虚拟环境测试部署应用
  • CentOS本机配置为时间源
  • 蓝桥杯备赛 Day14 素数环
  • 小程序canvas2d实现横版全屏和竖版逐字的签名组件(字帖式米字格签名组件)
  • haproxy详解笔记
  • SpringCloud框架下的注册中心比较:Eureka与Consul的实战解析
  • 前端调用串口通信
  • 23、深度学习-自学之路-激活函数relu、tanh、sigmoid、softmax函数的正向传播和反向梯度。
  • 《8天入门Trustzone/TEE/安全架构》
  • 计算机视觉中图像的基础认知
  • MYSQL的管理备份
  • 数据仓库与数据挖掘记录 三
  • 第12周:LSTM(火灾温度)
  • MySQL的SQL执行流程
  • Foundation CSS 可见性
  • 7. Docker 容器数据卷的使用(超详细的讲解说明)
  • 算法——结合实例了解广度优先搜索(BFS)搜索
  • qt QCommandLineOption 详解
  • Linux权限提升-内核溢出