当前位置: 首页 > news >正文

【python实现】实时监测GPU,空闲时自动执行脚本

文章目录

  • 代码


代码

# author: muzhan
# contact: levio.pku@gmail.com
import os
import sys
import time
cmd = 'nohup python -u train_post_2d_aut.py > output1.log &'    # gpu空闲时,需要执行的脚本命令
def gpu_info():gpu_status = os.popen('nvidia-smi | grep %').read().split('|')# 监控2号gpugpu_memory = int(gpu_status[10].split('/')[0].split('M')[0].strip())                   # max:12288gpu_power = int(gpu_status[9].split('   ')[-1].split('/')[0].split('W')[0].strip())   # max:250# 监控3号gpu# gpu_memory = int(gpu_status[14].split('/')[0].split('M')[0].strip())  # max:12288# gpu_power = int(gpu_status[13].split('   ')[-1].split('/')[0].split('W')[0].strip())# 获取空闲的功率和内存power_all, memory_all = 250, 12288       # gpu功率和内存的最大值power_free = power_all - gpu_powermemory_free = memory_all - gpu_memoryreturn power_free, memory_free
def narrow_setup(interval=2):power_free, memory_free = gpu_info()i = 0while not (memory_free > 7000 and power_free > 175):  # 如果空闲的内存和功率大于指定阈值,就执行cmd脚本power_free, memory_free = gpu_info()i = i % 10symbol = 'monitoring: ' + '>' * i + ' ' * (10 - i - 1) + '|'gpu_power_str = 'gpu power_free:%d W |' % power_freegpu_memory_str = 'gpu memory_free:%d MiB |' % memory_freesys.stdout.write('\r' + gpu_memory_str + ' ' + gpu_power_str + ' ' + symbol)sys.stdout.flush()time.sleep(interval)     # 每2s检测一次i += 1print('\n' + cmd)os.system(cmd)if __name__ == '__main__':narrow_setup()
http://www.lryc.cn/news/363804.html

相关文章:

  • chrome 浏览器历史版本下载
  • 【设计模式】工厂模式(创建型)⭐⭐⭐
  • Postman 连接数据库 利用node+xmysql
  • 挑战你的数据结构技能:复习题来袭【6】
  • 如何反编译jar并修改后还原为jar
  • 统计信号处理基础 习题解答10-5
  • Vue3实战笔记(60)—从零开始:一步步搭建Vue 3自定义插件
  • Java面向对象笔记
  • 如何通过PHP语言实现远程控制多路照明
  • Capture One Pro 23:专业 Raw 图像处理的卓越之选
  • 【主题广泛|投稿优惠】2024年交通运输与信息科学国际会议(ICTIS 2024)
  • 表格误删数据保存关闭后如何恢复?5个恢复方法大公开!
  • Go 语言中的切片:灵活的数据结构
  • 在鲲鹏服务器搭建k8s高可用集群分享
  • MySQL之数据库事务机制学习笔记(五)
  • linux 系统被异地登录,cpu占用拉满100%
  • 智慧校园应用平台的全面建设
  • 图论第6天
  • Redis教程(二十一):Redis怎么保证缓存一致性
  • android apk签名
  • flutter 解析json另类封装方式 List<bean>,哈哈哈
  • 哈希表(Hash table)
  • 【c语言】自定义类型-结构体
  • 2-链表-71-环形链表 II-LeetCode142
  • 【UnityShader入门精要学习笔记】第十七章 表面着色器
  • Python社会经济 | 怀特的异方差一致估计量
  • 《被讨厌的勇气》笔记
  • Python爬虫协程批量下载图片
  • Flask Web开发基础:数据库与ORM实战
  • pidstat -d 1分析磁盘吞吐量