当前位置: 首页 > news >正文

NCCL报错

1、报错信息:

raise RuntimeError("Distributed package doesn't have NCCL " "built in")

RuntimeError: Distributed package doesn't have NCCL built in

2、报错原因:

  windows系统不支持nccl,采用gloo;

3、报错解决:

  代码开头添加:

import os 
os.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"

或者

init_process_group(backend="nccl", rank=rank, world_size=world_size)# 修改为 
init_process_group(backend="gloo", rank=rank, world_size=world_size)

# windows users may have to use "gloo" instead of "nccl" as backend

# nccl: NVIDIA Collective Communication Library#

#windows用户可能必须使用“gloo”而不是“nccl”作为后端

#nccl:NVIDIA集体通信库

http://www.lryc.cn/news/463039.html

相关文章:

  • 域7:安全运营 第16章 安全运营管理
  • 研发线上事故风险解读之数据库存储
  • react hooks中在setState后输出state为啥没有变化,如何解决
  • C++设计模式——代理模式
  • docker 复制文件,清除不再使用数据导出以及导出文件系统
  • 【Vue】Vue3.0(十一)Vue 3.0 中 computed 计算属性概念、使用及示例
  • 【第三版 系统集成项目管理工程师】第17章 法律法规和标准规范
  • 安装 LLM 编程工具 cursor
  • Java链式编程的定义、例子、使用方法、实际应用场景、自动装配构造
  • 用 Git Stash 临时保存修改,轻松切换任务!
  • Android 下通过触发 SIGTRAP 信号实现反调试
  • 【MySQL】 表的增删操作
  • 新生入门季 | 学习生物信息分析,如何解决个人电脑算力不足的问题?
  • 20255 - 中医方剂学 - 考研 - 执业
  • 【Vue.js设计与实现】第三篇第9章:渲染器-简单Diff算法-阅读笔记
  • 服务器软件之Tomcat
  • Flutter包管理(三)
  • CGNS资料
  • 论文阅读(十六):Deep Residual Learning for Image Recognition
  • Dubbo 序列化方式
  • 如何替换OCP节点(二):使用 antman脚本 | OceanBase应用实践
  • 15.JVM垃圾收集算法
  • 软件工程:图书管理系统甘特图
  • 视频的编解码格式
  • 网络资源模板--Android Studio 实现简易新闻App
  • LabVIEW提高开发效率技巧----离线调试
  • 6N137S1取反电路图
  • Nullinux:一款针对Linux操作系统的安全检测工具
  • 学会这 5 个 AI 神器做字体设计,保证让你私单接到爆!
  • 《Vue3 踩坑》expose 和 defineExpose 暴露属性或方法注意事项