当前位置: 首页 > news >正文

nsight-system教程

一 安装

参考

nsight-compute使用教程-CSDN博客icon-default.png?t=O83Ahttps://blog.csdn.net/youzjuer/article/details/142549332

二 使用

nsys profile -t cuda,nvtx --force-overwrite true -o xxxx python xxx.py

xxxx表示生成文档的名字 

如果是cuda c 则 python xxx.py替换为./xxx即可

这个命令主要是使用Nsight Systems的nsys命令来进行性能分析。通过使用这个命令,我们可以分析CUDA应用程序的性能,捕获CUDA和NVTX的相关信息,并生成相应的性能分析文件以供进一步分析和优化。

nsys profile:这部分指明要使用nsys命令以进行性能分析。

-t cuda,nvtx:这个选项表示在分析中包含CUDA和NVTX(NVIDIA Tools Extension)的信息。CUDA是NVIDIA的并行计算平台,用于GPU加速计算;而NVTX可以允许用户在代码中注入标记,用于更好地跟踪和可视化程序执行情况。

--force-overwrite true:这个选项用于指示如果已经存在同名文件,是否强制覆盖。在这个情况下,设置为true表示如果已经存在相同名字的输出文件,将强制覆盖该文件。

-o /path/to/your/nsys-reg/where/save:这个选项指定了性能分析输出文件的路径和名称。在这个例子中,输出文件被命名为mobilenetv2_batchsize8_profile,并保存在/路径下。

python nsight_trace.py:这部分是需要进行性能分析的命令。在这个例子中,是运行nsight_trace.py这个Python脚本。nsys会捕获该命令的执行过程,并生成相应的性能分析文件。

此时我们已经得到了追踪文件
,所以打开nsys-ui.exe. 依次鼠标单击:菜单栏-》File-》Open-》选中到nsys-rep文件目标并双击该文件。此时等待软件读取即可看见设备运行的详细过程了。 

http://www.lryc.cn/news/446673.html

相关文章:

  • 进程的那些事--进程控制
  • FortiOS SSL VPN 用户访问权限配置
  • C++_vector类
  • Spring Boot入门到精通:网上购物商城系统
  • 在Vue.js中,你可以使用Element UI的el-input组件结合计算属性来实现模糊查询
  • delphi制作漂亮的农历窗体(IntraWeb+Layui的完美结合)
  • 发票OFD格式转换成PDF
  • 高通AI应用程序开发3:网络模型(一)
  • 03. 前端面试题之ts : typescript 的数据类型有哪些?
  • PyCharm和VS Code 安装通义灵码,可本地安装包安装,解决插件安装不上问题
  • 机器人速度雅可比矩阵求解(2自由度平面关节机器人)
  • 【AI大模型-文心-思维树解读-开篇】
  • 2、electron vue3 怎么创建子窗口,并给子窗口路由传参
  • 8.pod数据持久化
  • C语言 | Leetcode C语言题解之第436题寻找右区间
  • SpringBoot3中ymal配置文件(持续更新)
  • Linux 基础IO 2
  • 图像预处理 图像去噪之常见的去噪方法
  • 代码随想录Day53|102.沉没孤岛 、103.水流问题 、104.建造最大岛屿
  • 19c-pfile
  • 智能软件开启精准品牌控价
  • OpenCV特征检测(8)检测图像中圆形的函数HoughCircles()的使用
  • spark 大表与大表join时的Shuffle机制和过程
  • 大厂面试真题:简单说下Redis的bigkey
  • 18 vue3之自动引入ref插件深入使用v-model
  • 【Spring】lombok、dbUtil插件应用
  • 【学习笔记】WSL
  • python assert 断言用法
  • MySQL事务、索引、数据恢复和备份
  • 什么是chatgpt?国内有哪些类gpt模型?