当前位置: 首页 > news >正文

大模型调试debug记录

环境:Linux , cuda 11.7

  1. RuntimeError: Distributed package doesn't have NCCL built in 

原因:pytorch安装的是cpu版本,需要安装支持gpu版本的

RuntimeError: Distributed package doesn't have NCCL built in - #3 by bdabykov - distributed - PyTorch Forums

2. NotImplementedError: Cannot copy out of meta tensor; no data!

原因:显存不够

http://www.lryc.cn/news/144816.html

相关文章:

  • 对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键
  • DP读书:鲲鹏处理器 架构与编程(十二)鲲鹏软件实战案例
  • 前端 -- 基础 VSCode 工具生成骨架标签新增代码 解释详解
  • 爬虫逆向实战(二十三)--某准网数据
  • ruoyi--数据权限
  • 快速开发平台是什么?和传统开发平台相比有哪些区别?
  • Android基于JNI的Java与C++互调
  • 【算法与数据结构】513、LeetCode找树左下角的值
  • React——组件缓存 react-activation
  • EV代码签名证书是什么?
  • 融媒行业落地客户旅程编排,详解数字化用户运营实战
  • PDF制作成翻页电子书
  • 多线程
  • BingChat与ChatGPT比较,哪个聊天机器人能让你获益更多?
  • Qt读写ini配置文件(QSettings)、XML
  • JVM知识点(二)
  • 代码随想录算法训练营day44 | LeetCode 518. 零钱兑换 II 377. 组合总和 Ⅳ
  • Vue2向Vue3过度核心技术工程化开发和脚手架
  • Expected all tensors to be on the same device, but found at least two devices
  • Mysql备份命令Mysqldump导入、导出以及压缩成zip、gz格式
  • App卡帧与BlockCanary
  • bpmnjs Properties-panel拓展(ExtensionElements拓展篇)
  • 虚拟机的使用
  • CSS Flex布局
  • Virtual
  • 6、监测数据采集物联网应用开发步骤(5.2)
  • 解释 Git 的基本概念和使用方式
  • 不同ubuntu系统下的不同ros系统可以互相通讯吗
  • 数学建模-模型详解(2)
  • IT运维:使用数据分析平台监控DELL服务器