当前位置: 首页 > news >正文

paddlepaddle显存未正常释放

NVIDIA GPU 显存未正常释放

问题描述

paddlepaddle 训练过程出现问题中断等导致GPU显存没有释放。

情况1:

使用nvidia-smi -l查看显存占用情况,输出结果中没有显示PID,但是有显存占用。
example1

解决方法

  1. 使用killall python 直接kill掉所有python进程。
  2. 假如运行此命令后仍然有上述问题使用下面命令
    fuser -v /dev/nvidia0 |grep [0-9]得到显卡0的进程的PID(红色数字)
    oup1
    复制PID并使用kill -9 杀掉进程
    example :
kill -9 2304558 2304560 2304562 2304564 2304566 2304568 2304570 2304572 2304574 2304576 2304578 2304580 2304885 2304887 2304889 2304891 2304893 2304895 2304897 2304899 2304901 2304903 2304905 2304907 2306892 2306894 2306896 2306898 2306900 2306902 2306904 2306906 2306908 2306910 2306912 2306914

结果

重新nvidia-smi -l 1
oup2

http://www.lryc.cn/news/465183.html

相关文章:

  • websocket的使用
  • docker如何建立本地私有仓库,并将docker镜像推到私有仓库
  • vllm启动大语言模型时指定chat_template
  • 网络相关(HTTP/TCP/UDP/IP)
  • TF卡长期不用会丢失数据吗?TF卡数据恢复容易吗?
  • Flink状态一致性保证
  • 前端一键复制解决方案分享
  • 麒麟操作系统swap使用率过高的排查思路
  • 爬虫python=豆瓣Top250电影
  • 【Eclipse系列】解决Eclipse中xxx.properties文件中文乱码问题
  • mysql主从复制及故障修复
  • 基于springboot的网上服装购物商城系统
  • aws(学习笔记第六课) AWS的虚拟私有,共有子网以及ACL,定义公网碉堡主机子网以及varnish反向代理
  • 接口测试(三)jmeter——连接mysql数据库
  • 双十一购物节有哪些好物值得入手?2024双十一好物清单合集分享
  • jmeter中请求参数:Parameters、Body Data的区别
  • Docker安装ActiveMQ镜像以及通过Java生产消费activemq示例
  • 迅为RK3562开发板/核心板240PIN引脚全部引出,产品升级自如
  • C++实现顺序栈和链栈操作(实验3--作业)
  • 龙兴物联一体机:设备监测的智能先锋
  • KinectDK相机SDK封装Dll出现k4abt_tracker_create()创建追踪器失败的问题
  • Linux 命令—— ping、telnet、curl、wget(网络连接相关命令)
  • 高速缓冲存储器Cache是如何工作的、主要功能、高速缓冲存储器Cache和主存有哪些区别
  • 极简版Java敏感词检测SDK
  • H3C路由器交换机操作系统介绍
  • 【项目案例】-音乐播放器-Android前端实现-Java后端实现
  • EasyX图形库的安装
  • 数据结构 - 队列
  • 基于springboot美食推荐商城的设计与实现
  • React开发一个WebSocket