当前位置: 首页 > news >正文

在Ubuntu 22.04 LTS中使用PyTorch深度学习框架并调用多GPU时遇到indexSelectLargeIndex相关的断言失败【笔记】

在Ubuntu 22.04 LTS系统中,已安装配置好CUDA 12.4、cuDNN 9.1.1以及PyTorch环境

export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7

在PyTorch深度学习框架训练调用多GPU时,提示

indexSelectLargeIndex: block: [x, 0, 0], thread: [x, 0, 0] Assertion `srcIndex < srcSelectDimSize` failed. 

对于Intel平台的超微主板,

1.可以在BIOS的“Advanced” >> “Chipset Configuration” >> “North Bridge” >> “IIO Configuration” >> “Intel VT for Directed I/O (VT-d)”中关闭。(现场是关闭Intel VT for Directed I/O (VT-d)

2.同时关闭ACS Control。

BIOS参数调整后,深度学习训练正常调用多GPU。

说明
本文档所提供的指引和参考主要基于特定实践设备的操作经验。由于不同设备在硬件配置、软件版本、使用场景等方面可能存在差异,因此,当您在使用其他设备时,所遇到的问题可能与此文档所述有所不同。尽管如此,大部分设备的安装方法和基本步骤仍然保持相似。
请务必根据您所使用的设备的具体说明书和官方指导进行操作,以确保设备的正确安装和使用。如果在安装或使用过程中遇到任何问题,建议您查阅相关设备的官方支持文档或联系设备的售后服务团队以获取专业帮助。
再次强调,本文档仅供参考,不保证完全适用于所有系统。任何基于本文档进行的操作,需自行承担相应风险。

http://www.lryc.cn/news/505721.html

相关文章:

  • qt 类中的run线程
  • Vue3父子组件传属性和方法调用Demo
  • aac怎么转为mp3?操作起来很简单的几种aac转mp3的方法
  • 结合mybatis-plus实现Function获取java实体类的属性名
  • vue 响应式数据原理
  • android 计算CRC
  • Linux tinyproxy 使用教程
  • 局部规划器设计思路
  • 数字图像处理技术期末复习
  • UITableView显示数据,增加数据,删除数据及移动数据行
  • 金智塔科技喜获CCF中国数字金融大会 GraphRAG竞赛二等奖
  • 方案解读:数字化扩展中如何提升多云应用安全能力?
  • “年轻科技旗舰”爱玛A7 Plus正式发布,全国售价4999元
  • oracle开窗函数笔记、over()笔记
  • 【HarmonyOS】HarmonyOS 和 Flutter混合开发 (一)之鸿蒙Flutter环境安装
  • 海外招聘丨卢森堡大学—人工智能和机器学习中的 PI 用于图像分析
  • LeetCode hot100-85
  • linux 内核数据包处理中的一些坑和建议
  • C++ 的衰退复制(decay-copy)
  • vue-cli 5接入模块联邦 module federation
  • 【Rust自学】3.6. 控制流:循环
  • 【第八节】git与github
  • win如何访问Linux数据库(本地)
  • Windows设置所有软件默认以管理员身份运行
  • 前端 计算发布时间(如“1小时前”、“3天前”等)
  • shardingjdbc 4.0.0 seata分布式事务Failed to fetch schema问题
  • 罗德与施瓦茨NRT2功率反射仪,NRT2通过式功率计
  • QLineEdit限制输入固定字节数(UTF-8编码)
  • 基于ubuntu的mysql 8.0安装教程
  • K8s ConfigMap的基础功能介绍