当前位置: 首页 > news >正文

npu-smi info 华为昇腾NPU 状态监控工具解读

npu-smi info 用于查询所有设备的基本信息。

命令格式

npu-smi info

参数说明

使用指南

  • 当设备上未运行进程时,回显信息中会显示“No running processes found in NPU card_id”。
  • 本命令只能查询到命令执行场景下所运行的进程。
  • 每个芯片上最多显示8个device侧SVM相关的进程信息。

表4-3 部署场景

产品形态

Linux物理机

Linux物理机容器

root用户

运行用户组(非root用户)

root用户

Atlas 300I 推理卡(型号 3000)

Y

Y

Y

Atlas 300I 推理卡(型号 3010)

Y

Y

Y

使用实例

查询所有设备的基本信息。

 npu-smi info
+--------------------------------------------------------------------------------------------------------+
| npu-smi 24.1.RC3                                 Version: 24.1.RC3                                     |
+-------------------------------+-----------------+------------------------------------------------------+
| NPU     Name                  | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device                | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===============================+=================+======================================================+
| 4       xxx                   | OK              | 12.8         49               229812/ 232892         |
| 0       0                     | 0000:88:00.0    | 0            854  / 7759                             |
+-------------------------------+-----------------+------------------------------------------------------+
| 4       xxx                   | OK              | 12.8         51               229912/ 232992         |
| 1       1                     | 0000:89:00.0    | 0            853  / 7759                             |
+-------------------------------+-----------------+------------------------------------------------------+
| 4       xxx                   | OK              | 12.8         52               178284/ 181364         |
| 2       2                     | 0000:8A:00.0    | 0            854  / 7759                             |
+-------------------------------+-----------------+------------------------------------------------------+
| 4       xxx                   | OK              | 12.8         49               230164/ 233244         |
| 3       3                     | 0000:8B:00.0    | 0            852  / 7759                             |
+===============================+=================+======================================================+
+-------------------------------+-----------------+------------------------------------------------------+
| NPU     Chip                  | Process id      | Process name             | Process memory(MB)        |
+===============================+=================+======================================================+
| 4       0                     | 39193           | hlt_host_devmm_          | 675                       |
| 4       0                     | 39165           | hlt_host_devmm_          | 682                       |
| 4       0                     | 39157           | hlt_host_devmm_          | 681                       |
| 4       0                     | 39177           | hlt_host_devmm_          | 682                       |
| 4       0                     | 39169           | hlt_host_devmm_          | 683                       |
| 4       0                     | 39189           | hlt_host_devmm_          | 681                       |
| 4       0                     | 39209           | hlt_host_devmm_          | 682                       |
| 4       0                     | 39161           | hlt_host_devmm_          | 681                       |
| 4       1                     | 39210           | hlt_host_devmm_          | 683                       |
| 4       1                     | 39182           | hlt_host_devmm_          | 685                       |
| 4       1                     | 39202           | hlt_host_devmm_          | 684                       |
| 4       1                     | 39162           | hlt_host_devmm_          | 682                       |
| 4       1                     | 39154           | hlt_host_devmm_          | 683                       |
| 4       1                     | 39174           | hlt_host_devmm_          | 681                       |
| 4       1                     | 39166           | hlt_host_devmm_          | 685                       |
| 4       1                     | 39186           | hlt_host_devmm_          | 681                       |
| 4       2                     | 39155           | hlt_host_devmm_          | 682                       |
| 4       2                     | 39215           | hlt_host_devmm_          | 683                       |
| 4       2                     | 39167           | hlt_host_devmm_          | 685                       |
| 4       2                     | 39187           | hlt_host_devmm_          | 683                       |
| 4       2                     | 39207           | hlt_host_devmm_          | 682                       |
| 4       2                     | 39159           | hlt_host_devmm_          | 683                       |
| 4       2                     | 39211           | hlt_host_devmm_          | 682                       |
| 4       2                     | 39171           | hlt_host_devmm_          | 681                       |
| 4       3                     | 39160           | hlt_host_devmm_          | 683                       |
| 4       3                     | 39212           | hlt_host_devmm_          | 683                       |
| 4       3                     | 39172           | hlt_host_devmm_          | 682                       |
| 4       3                     | 39192           | hlt_host_devmm_          | 681                       |
| 4       3                     | 39204           | hlt_host_devmm_          | 675                       |
| 4       3                     | 39164           | hlt_host_devmm_          | 682                       |
| 4       3                     | 39216           | hlt_host_devmm_          | 681                       |
| 4       3                     | 39156           | hlt_host_devmm_          | 683                       |
+===============================+=================+======================================================+

输出说明

表4-4 打印信息说明

字段

说明

npu-smi

npu-smi 工具版本

Version

驱动版本

NPU

设备id

Name

芯片名称

Health

芯片的健康状态

有如下五种状态:OK、Warning、Alarm、Critical或UNKNOWN

  • OK:正常
  • Warning:一般告警
  • Alarm:重要告警
  • Critical:紧急告警
  • UNKNOWN:该设备不存在或未启动

Power(W)

芯片功率

Temp(C)

芯片温度(单位:°C)

Hugepages-Usage(page)

大页内存占比(单位:page),每一个page的大小是2048KB。

Chip

芯片id

Device

芯片编号

Bus-Id

BUS id

AICore(%)

AICore占用率

Memory-Usage(MB)

内存占比

Process id

进程id

Process name

进程名称

Process memory(MB)

进程占用的内存(单位:MB)

http://www.lryc.cn/news/583026.html

相关文章:

  • 类与对象【下篇】-- 关于类的其它语法
  • 树莓派vsftpd文件传输服务器的配置方法
  • 【02】MFC入门到精通——MFC 手动添加创建新的对话框模板
  • overleaf 改为XeLatex
  • Vue响应式原理四:响应式-监听属性变化
  • 正点原子学习 用户权限管理
  • 【python基础】运算符与布尔值全解析
  • 智慧航天运载体系全生命周期监测 | 图扑数字孪生
  • Shader面试题100道之(41-60)
  • 从0实现线性回归模型
  • vue3.2 前端动态分页算法
  • 「Java案例」打印数字金字塔
  • [Backlog] 核心协调器 | 终端用户界面(TUI)实现 | 多分支任务冲突解决 | 测试验证体系
  • 技术支持丨解决 ServBay 在 Windows 启动时反复提示安装 .NET 的问题
  • Python(30)基于itertools生成器的量子计算模拟技术深度解析
  • 使用LLaMA-Factory微调Qwen2.5-VL-3B 的目标检测任务-数据集格式转换(voc 转 ShareGPT)
  • 【洛谷题单】--顺序结构(一)
  • C++高频知识点(六)
  • [NOIP][C++]洛谷P1376 [USACO05MAR] Yogurt factory 机器工厂
  • LeetCode--42.接雨水
  • C++(STL源码刨析/vector)
  • 从历史航拍图像中去除阴影
  • 11款常用C++在线编译与运行平台推荐与对比
  • 力扣-75.颜色分类
  • Web后端开发-Mybatis
  • qt-C++笔记之setCentralWidget的使用
  • 软件系统测试的基本流程
  • 数据结构*搜索树
  • 从零开始手写嵌入式实时操作系统
  • 牛市来临之际,如何用期权抢占反弹先机?