当前位置: 首页 > news >正文

【知识】cuda检测GPU是否支持P2P通信及一些注意事项

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn]

如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~

代码流程

  1. 先检查所有GPU之间是否支持P2P通信;
  2. 然后尝试启用GPU之间的P2P通信;
  3. 再次检查所有GPU之间是否支持P2P通信。

test.cu:

#include <stdio.h>
#include <cuda_runtime.h>void checkP2P(int deviceCount) {printf("\nChecking initial P2P support:\n");for (int i = 0; i < deviceCount; i++) {for (int j = 0; j < deviceCount; j++) {if (i != j) {int canAccessPeer = 0;cudaDeviceCanAccessPeer(&canAccessPeer, i, j);printf("GPU %d -> GPU %d: %s\n", i, j, canAccessPeer ? "Supported" : "Not Supported");}}}
}void enableP2P(int deviceCount) {printf("\nEnabling P2P:\n");for (int i = 0; i < deviceCount; i++) {cudaSetDevice(i);for (int j = 0; j < deviceCount; j++) {if (i != j) {int canAccessPeer = 0;cudaDeviceCanAccessPeer(&canAccessPeer, i, j);if (canAccessPeer) {cudaError_t err = cudaDeviceEnablePeerAccess(j, 0);if (err == cudaSuccess) {printf("P2P enabled between GPU %d and GPU %d.\n", i, j);} else {printf("Failed to enable P2P between GPU %d and GPU %d: %s\n", i, j, cudaGetErrorString(err));}}}}}
}void recheckP2P(int deviceCount) {printf("\nRechecking P2P support after enabling:\n");for (int i = 0; i < deviceCount; i++) {for (int j = 0; j < deviceCount; j++) {if (i != j) {int canAccessPeer = 0;cudaDeviceCanAccessPeer(&canAccessPeer, i, j);printf("GPU %d -> GPU %d: %s\n", i, j, canAccessPeer ? "Enabled" : "Disabled");}}}
}int main() {int deviceCount;cudaGetDeviceCount(&deviceCount);if (deviceCount < 2) {printf("At least two GPUs are required for P2P testing.\n");return 0;}printf("Detected %d GPUs.\n", deviceCount);// Step 1: Check initial P2P supportcheckP2P(deviceCount);// Step 2: Enable P2PenableP2P(deviceCount);// Step 3: Recheck P2P supportrecheckP2P(deviceCount);return 0;
}

编译:

nvcc -o test test.cu

执行:

./test.cu


注意事项

1、官方提供的cuda_tool里的simpleP2P、p2pBandwidthLatencyTest也都可以检测是否支持P2P。

2、Bridges间不支持P2P通信:deploying-managing-gpu-clusters

3、相同PCIe complex下是支持P2P:ParallelComputing


部分不支持P2P的类型

Nvidia Confirms GeForce Cards Lack P2P

http://www.lryc.cn/news/511230.html

相关文章:

  • 用 Python 生成功能强大的二维码工具(支持自定义颜色与 Logo)
  • RTX5 数据队列传输流程
  • 24.try块怎么用 C#例子
  • 【机器学习 | 数据挖掘】智能推荐算法
  • 120.【C语言】数据结构之快速排序(详解Hoare排序算法)
  • uniapp通过v-if进行判断时,会出现闪屏?【已解决】
  • 各种网站(学习资源、常用工具及其他,持续更新中~)
  • 网络技术-QoS策略以及如何定义 流分类,流行为,流策略
  • 线程晨考day20
  • 【ES6复习笔记】迭代器(10)
  • MySQL的TIMESTAMP类型字段非空和默认值属性的影响
  • 【Linux进程】初悉进程
  • Python学习之路(5)— 使用C扩展
  • 动态规划34:446. 等差数列划分 II - 子序列
  • PPT画图——如何设置导致图片为600dpi
  • 【模块系列】STM321.69TFT屏幕
  • 大模型辅助测试的正确打开方式?
  • 三相电的相电压、线电压、额定值、有效值,变比,零序电压,零序电流,三相三线制的三角形连接,三相四线制的星形连接
  • 电商网站的基础用户数在100万,日活跃用户数在1万左右,系统下单TPS最大支持1000,应用服务要保证高可用。请预估该网站每天的使用成本。
  • 线性代数期末总复习的点点滴滴(1)
  • python+reportlab创建PDF文件
  • 2024最新qrcode.min.js生成二维码Demo
  • 【Microi吾码】开源力量赋能低代码创新,重塑软件开发生态格局
  • Github - 如何提交一个带有“verified”标识的commit
  • HCIA笔记9--NAT、ACL与链路聚合
  • SCSA:探索空间与通道注意力之间的协同效应
  • 深度学习助力股市预测:LSTM、RNN和CNN模型实战解析
  • 组件库TDesign的表格<t-table>的使用,行列合并以及嵌入插槽实现图标展示,附踩坑
  • jwt在express中token的加密解密实现方法
  • 结构体、共用体的字节对齐