当前位置: 首页 > news >正文

RK3568 NPU RKNN(四):RKNN-ToolKit2性能和内存评估

文章目录

  • 1、前言
  • 2、目标
  • 3、完整的测试程序
  • 4、运行测试程序
  • 5、程序拆解
  • 6、总结

1、前言

本文仅记录本人学习过程,不具备教学指导意义。

2、目标

使用野火提供的示例程序,体验 RKNN-ToolKit2 在PC端使用连板推理,进行性能和内存评估。

3、完整的测试程序

from rknn.api import RKNNRKNN_MODEL = 'yolov5s.rknn'
IMG_PATH = './bus.jpg'
DATASET = './dataset.txt'if __name__ == '__main__':# 创建RKNN# 如果测试遇到问题,请开启verbose=True,查看调试信息。#rknn = RKNN(verbose=True)rknn = RKNN()# 导入RKNN模型,path参数指定模型路径print('--> Loading model')ret = rknn.load_rknn(path=RKNN_MODEL)if ret != 0:print('Load model failed!')exit(ret)print('done')# 初始化运行时环境,指定连接的板卡NPU平台,# perf_debug开启进行性能评估时开启debug模式,eval_mem进入内存评估模式print('--> Init runtime environment')ret = rknn.init_runtime(target='rk3588', device_id='4c52ebe8f0ee8e63', perf_debug=True, eval_mem=True)if ret != 0:print('Init runtime environment failed!')exit(ret)print('done')# 模型性能进行评估,默认is_print是true,打印内存使用情况print('--> eval_perf')rknn.eval_perf()print('done')# 调试,模型性能进行评估,默认is_print是true,打印内存使用情况print('--> eval_memory')rknn.eval_memory()print('done')rknn.release()

4、运行测试程序

这里电脑使用usb type-c线和板卡otg接口连接。同时板卡需要先开启rknn_server服务:

cat@lubancat:/ rknn_server &

电脑端执行程序:

cd lubancat_ai_manual_code/dev_env/rknn_toolkit2/examples/evaluation/yolov5
python3 test.py

程序执行之初,会打印板卡端rknn_serverrknnrt的版本,请确保版本一致:

rknn_serverrknnrt获取方式:

# 1. 从野火提供的工程源码中获取
# 在 lubancat_ai_manual_code/dev_env/rknpu2/runtime/ 目录下# 2. 在官网获取:
# 在 https://github.com/airockchip/rknn-toolkit2/tree/master/rknpu2/runtime 目录下

程序运行结束:

5、程序拆解

  1. 加载 rknn 模型
ret = rknn.load_rknn(path=RKNN_MODEL)
  • RKNN_MODEL 指向模型文件路径(例:yolov5s.rknn)。
  1. 初始化运行环境
ret = rknn.init_runtime(target='rk3588', device_id='4c52ebe8f0ee8e63', perf_debug=True, eval_mem=True)
  • 初始化 RKNN 推理环境。
    • target:指定连接的平台为rk3588
    • device_id:指定连接的平台的adb device id
    • perf_debug:开启进行性能评估时开启debug模式
    • eval_mem:eval_mem进入内存评估模式
  1. 模型性能评估
rknn.eval_perf()
  • 评估模型性能。
  • 模型必须运行在与 PC 连接的 RK3566 / RK3568 / RK3588 / RV1103 / RV1106 上。如果初始化运行环境时设置 perf_debug 为 False,则获得的是模型在硬件上运行的总时间;如果设置 perf_debug为 True,除了返回总时间外,还将返回每一层的耗时情况。
  1. 获取内存使用情况
rknn.eval_memory()
  • 获取模型在硬件平台运行时的内存使用情况。模型必须运行在与 PC 连接的 RK3566 / RK3568 / RK3588 / RV1103 / RV1106 上。

6、总结

参考文章:

https://doc.embedfire.com/linux/rk356x/Ai/zh/latest/lubancat_ai/env/toolkit2.html#id9

http://www.lryc.cn/news/622647.html

相关文章:

  • Vue3从入门到精通:5.2 Vue3构建工具与性能优化深度解析
  • 微软Wasm学习-创建一个最简单的c#WebAssembly测试工程
  • PHP域名授权系统网站源码_授权管理工单系统_精美UI_附教程
  • 【C 学习】06-算法程序设计举例
  • [1Prompt1Story] 注意力机制增强 IPCA | 去噪神经网络 UNet | U型架构分步去噪
  • 智慧景区导览系统:基于WebGL的手绘地图导览设计与应用,DeepSeek大模型赋能精准游客引导服务
  • OBOO鸥柏丨75寸/86平板企业办公会议触控一体机核心国产化品牌招投标参数
  • eChart饼环pie中间显示总数_2个以上0值不挤掉
  • VS Code配置MinGW64编译非线性优化库NLopt
  • AI云电脑盒子技术分析——从“盒子”到“算力云边缘节点”的跃迁
  • JetPack系列教程(八):PDF库——让Android应用也能优雅“翻页”
  • 面试问题详解一:什么是 Qt?
  • 数字分类:机器学习经典案例解析
  • 电路方案分析(二十一)笔记本电脑散热风扇参考设计
  • Dify 从入门到精通(第 38/100 篇):Dify 的实时协作功能
  • 日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(2):11-20语法
  • 【学习嵌入式day-26-线程间通信】
  • 音视频学习(五十四):基于ffmpeg实现音频重采样
  • 学习游戏制作记录(制作系统与物品掉落系统)8.16
  • Redis 04 Reactor
  • 【Java web】Servlet 详解
  • 数据可视化怎么结合数字孪生?实战心得:从数据到场景的 3 步走
  • 学习嵌入式第三十天
  • WSL中占用磁盘空间大问题解决
  • 通过rss订阅小红书,程序员将小红书同步到自己的github主页
  • 消息中间件Tibco 和 Kafka 及 Pulsar
  • 【LeetCode 热题 100】70. 爬楼梯——(解法二)自底向上
  • 《从入门到精通:Kafka核心原理全解析》
  • 博弈论07——Lemke-Howson 算法
  • EXTI外部中断的执行逻辑|以对射式红外传感器计次为例