当前位置: 首页 > news >正文

指定GPU跑模型

加上一个CUDA_VISIBLE_DEVICES=0,2就行了,使用0卡和2卡跑模型,注意多卡有时候比单卡慢,4090无NVlink,数据似乎是通过串行的方式传输到多个gpu的,只不过单个gpu是并行计算,数据在gpu与gpu之间似乎是串行传输的,如果第一个卡的显存实在是太过于紧张,只有几十mb可用也可能导致cuda out of memory!
指定0卡和2卡

CUDA_VISIBLE_DEVICES=0,2 python main.py

指定2卡

CUDA_VISIBLE_DEVICES=2 python main.py

----->
确保CUDA可用,安装了与cuda对应的pytorch

import torch
print(torch.cuda.is_available())
http://www.lryc.cn/news/378117.html

相关文章:

  • Windows桌面运维----第五天
  • bash和dash的区别(及示例)
  • Java基础入门day65
  • 解密制度的规定和解密工作的具体流程
  • 实际中常用的网络相关命令
  • 机器学习补充
  • 机器学习——RNN、LSTM
  • Java项目学习(员工管理)
  • 视觉SLAM14精讲——相机与图像3.3
  • 【路径规划】基于粒子群结合遗传算法实现机器人栅格地图路径规划
  • 内容安全复习 9 - 身份认证系统攻击与防御
  • Python-gui开发之Pycharm+pyside6/Pyqt6环境搭建
  • 大数据开发语言Scala入门 ,如何入门?
  • 【人机交互 复习】第1章 人机交互概述
  • HCIP-HarmonyOS Device Developer 课程大纲
  • 蓝桥杯 经典算法题 查找两个总和为特定值的索引
  • Java | Leetcode Java题解之第169题多数元素
  • 十大机器学习算法深入浅出
  • 【论文笔记】Parameter-Effificient Transfer Learning for NLP
  • Qt异常处理
  • 【ElasticSearch】ElasticSearch实战
  • 48-3 内网渗透 - 令牌操纵
  • 架构师之 Kafka 核心概念入门
  • Redis通用命令详解
  • 物联网设备安装相关知识整理
  • React实现H5手势密码
  • [leetcode hot 150]第十五题,三数之和
  • 视频AI分析定时任务思路解析
  • tcp 粘包和拆包 及 解决粘包方案
  • 【2024泰迪杯】B 题:基于多模态特征融合的图像文本检索20页论文及Python代码