当前位置: 首页 > news >正文

Segmentation fault 的bug解决

一,Segmentation fault 的bug解决

问题描述:自己在使用CPU上调试完代码之后,可以稳定运行,有输出结果。 但是把数据和模型加载上GPU之后,出现了报错。
Segmentation fault (core dumped)

搜了一下可能存在的原因

  1. 内存问题:深度学习模型通常需要大量的内存。如果你的模型太大,而 GPU 内存不足以容纳模型和数据,就会导致内存溢出,从而引发 Segmentation Fault。确保你的 GPU 具有足够的内存来处理你的模型和数据
  2. 不稳定的模型结构:有时,模型的结构或权重可能不稳定,可能导致 Segmentation Fault。确保你的模型结构正确,权重初始化合理。
  3. 驱动问题:GPU 驱动程序可能会出现问题,导致 Segmentation Fault。请确保你的 GPU 驱动程序是最新的,并且与 PyTorch 版本兼容。

解决手段:

  1. 检查你的模型大小和数据是否超出 GPU 内存。
    降低了数据的batchsize,但是模型依旧报错,segmentation fault

  2. 确保你的代码和模型没有 bug,包括权重初始化问题。
    代码应该没有bug, 因为在CPU上可以运行。

  3. 确保你的 GPU 驱动与你的pytorch版本是对应的。
    查看GPU版本和我的torch版本:
    如何查看torch的版本

print(torch.__version__)   # 2.0.1  
print(torch.cuda.is_available())    # False  

因为返回时False,所以版本匹配有问题。

查看 cuda 版本:nvcc -V
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

**重新安装: **
print(torch.version) # 2.0.1 +cu117
print(torch.cuda.is_available()) #True

原因找到,是cuda的版本不对应的问题。在下面网址找到对应的版本。
https://pytorch.org/get-started/previous-versions/

http://www.lryc.cn/news/207947.html

相关文章:

  • 【Python机器学习】零基础掌握BaggingRegressor集成学习
  • 麒麟KYLINOS通过命令行配置kysec的防火墙
  • 磁盘监控:告警时发送邮件
  • 【HarmonyOS】元服务卡片router实现跳转到指定页面并传动态参数
  • Centos安装RabbitMQ,JavaSpring发送RabbitMQ延迟延时消息,JavaSpring消费RabbitMQ消息
  • leetcode:1323. 6 和 9 组成的最大数字(python3解法)
  • SpringBoot集成Redis Cluster集群(附带Linux部署Redis Cluster高可用集群)
  • LLaVA:visual instruction tuning
  • Python实现双目标定、畸变矫正、立体矫正
  • showdoc 文件上传 (cnvd-2020-26585)
  • Java数据类型,变量与运算符
  • Linux nm命令
  • iOS发布证书.p12文件无密码解决办法及导出带密码的新.p12文件方法
  • OpenCamera拍照的代码流程
  • 华为OD机考算法题:矩阵最大值
  • 【Javascript】函数之形参与实参
  • PAT 乙级1090危险品装箱
  • Response Header中不暴露Server(IIS)版本、ASP.NET及相关版本等信息
  • 测试C#调用Vlc.DotNet组件播放视频
  • JS的事件委托(Event Delegation)
  • selenium+python自动化安装驱动 碰到的问题
  • laravel+vue2 element 一套项目级医院手术麻醉信息系统源码
  • GEE——使用MODIS GPP和LAI数据进行一元线性回归计算和R2分析
  • [论文阅读]Point Density-Aware Voxels for LiDAR 3D Object Detection(PDV)
  • 自动化学报格式 Overleaf 在线使用 【2023最新教程】
  • 掌握CSS动画技巧:打造引人注目的页面过渡效果!
  • 薛定谔的猫重出江湖?法国初创公司AliceBob研发猫态量子比特
  • 18亿欧元大动作,法国瞄准实现量子飞跃
  • 写保护设置——三、I2C EEPROM
  • 【嵌入式】HC32F07X ADC采样及软件滤波