当前位置: 首页 > news >正文

【Bug】Pytorch RuntimeError: DataLoader worker (pid(s) 15904) exited unexpectedly

【Bug1】RuntimeError: DataLoader worker (pid(s) 15904) exited unexpectedly

知乎:https://zhuanlan.zhihu.com/p/712407893

环境

Windows 11
Python 3.10
torch 2.0.1
numpy 1.25.0

问题详情

在使用 PyTorch 的 DataLoader 时出现的错误。详情

RuntimeError:An attempt has been made to start a new process before thecurrent process has finished its bootstrapping phase.This probably means that you are not using fork to start yourchild processes and you have forgotten to use the proper idiomin the main module:if __name__ == '__main__':freeze_support()...
.....
RuntimeError: DataLoader worker (pid(s) ) exited unexpectedly

意思是,这是运行时错误,是由于在主进程完成初始化之前试图启动了新的进程导致的错误。

错误的代码示例

import torch
from torch.utils.data import Dataset, DataLoaderimport numpy as np# 假设我们有一些简单的数据
data = np.array([1,2,3,4,5,6,7])  # np, tensor 格式都可以
targets = torch.tensor([1,1,1,1,0,0,0])  # 标签# 定义自定义数据集
class SimpleDataset(Dataset):def __init__(self, data, targets):self.data = dataself.targets = targetsdef __getitem__(self, index):x = self.data[index]y = self.targets[index]return x, ydef __len__(self):return len(self.data)# 实例化数据集
dataset = SimpleDataset(data, targets)# 创建 DataLoader, 如果启动多线程num_workers>=1,需要将启动代码放置在 if __name__ == "__main__": 下, 否则会报错
dataloader = DataLoader(dataset, batch_size=4, shuffle=True, num_workers=2)# 使用 DataLoader 迭代数据
for i, (batch_data, batch_label) in enumerate(dataloader):print(f"Batch {i}: batch_data: {batch_data}, batch_label: {batch_label}")

解决方法

【方法1】(不推荐)

这是由于多线程加载数据使用不当使用的错误,因此可以设置为单线程即可,num_workers 不设置或设置为0

dataloader = DataLoader(dataset, batch_size=4, shuffle=True, num_workers=0)

【方法2】

将涉及dataloader 的代码放置在if __name__ == "__main__": 下运行,修改代码如下

import torch
from torch.utils.data import Dataset, DataLoader
import numpy as np# 定义自定义数据集
class SimpleDataset(Dataset):def __init__(self, data, targets):self.data = dataself.targets = targetsdef __getitem__(self, index):x = self.data[index]y = self.targets[index]return x, ydef __len__(self):return len(self.data)def train():# 假设我们有一些简单的数据data = np.array([1,2,3,4,5,6,7])  # np, tensor 格式都可以targets = torch.tensor([1,1,1,1,0,0,0])  # 标签# 实例化数据集dataset = SimpleDataset(data, targets)# 创建 DataLoader, 如果启动多线程,需要将启动代码放置在 if __name__ == "__main__": 下, 否则会报错dataloader = DataLoader(dataset, batch_size=4, shuffle=True, num_workers=2)# 使用 DataLoader 迭代数据for i, (batch_data, batch_label) in enumerate(dataloader):print(f"Batch {i}: batch_data: {batch_data}, batch_label: {batch_label}")if __name__ == "__main__":train()

参考

解决pytorch报错:RuntimeError: DataLoader worker (pid(s) ***, ***, ***, ***) exited unexpectedly - 知乎 (zhihu.com)

http://www.lryc.cn/news/415886.html

相关文章:

  • 谈谈冯诺依曼体系
  • 第十二章 元数据管理10分
  • eco_tracker
  • electron 鼠标事件
  • 网络安全第一次作业(ubuntuan安装nginx以及php部署 and sql注入(less01-08)))
  • 【OpenHarmony4.1 之 U-Boot 2024.07源码深度解析】017 - init_sequence_f 各函数源码分析(一)
  • Mojo AI编程语言(十七)跨平台开发:应用广泛适配
  • Python面试题:结合Python技术,如何使用Astropy进行天文数据处理
  • Jpa-多表关联-OneToOne
  • zdpy+vue3+onlyoffice文档系统实战上课笔记 20240805
  • 【Linux 从基础到进阶】Linux 内核参数调优
  • 【Java数据结构】---泛型
  • Java Lambda表达式总结(快速上手图解)
  • 【算法模板】图论:Tarjan算法求割边割点
  • 如何在IDEA上使用JDBC编程【保姆级教程】
  • linux web系统安装常见问题解决,租房系统为案例
  • Linux驱动开发—平台总线模型详解
  • 说一下网络层,传输层,数据链路层做什么的,之间的关系?
  • 解锁AI新纪元:Milvus Cloud与Zilliz Cloud的高可用之道
  • svn安装
  • 【隐私计算篇】混淆电路之深入浅出
  • 基于GRU神经网络的微博分类预测
  • LVS-DR模式集群:案例与概念
  • 拓扑排序:Kahn算法与DFS算法
  • 图像处理 -- Sobel滤波器的实现原理与使用案例
  • 机器学习 第10章-降维与度量学习
  • linux驱动:(7)物理地址到虚拟地址映射
  • 浏览器用户文件夹详解 - Preferences(十)
  • Robot Operating System——电池电量通知
  • 二进制安装docker