当前位置: 首页 > news >正文

cuda-trt 学习

https://github.com/jinmin527/learning-cuda-trt

learning-cuda-trt

  • A large number of cuda/tensorrt cases
  • 在这个project中,提供大量的cuda和tensorrt学习案例
  • cuda驱动api
  • cuda运行时api
  • tensorRT基础入门
    • 基本的tensorRT学习
    • 插件、onnx解析器
  • tensorRT高阶应用
    • 导出onnx,前后处理
    • 具体项目为案例,掌握如何处理复杂情况

这是一个学习cuda、tensorrt的源代码案例项目

  1. 大量案例,从基础的cuda驱动api、运行时api到tensorrt的基础入门、tensorrt的高级进阶
  2. 模型的导出、模型的前后处理等等,多线程的封装等等
  3. 希望能够帮助你进一步掌握tensorRT

使用方法-自行配置环境

  1. 案例均使用makefile作为编译工具
    • 在其中以${@CUDA_HOME}此类带有@符号表示为特殊变量
    • 替换此类特殊变量为你系统真实环境,即可顺利使用
  2. 大部分时候,配置完毕后,可以通过make run实现编译运行

使用方法-自动配置环境

  1. 要求linux-ubuntu16.04以上系统,并配有GPU和显卡驱动大于495最佳
  2. 安装python包,pip install trtpy -U -i https://pypi.org/simple
  3. 配置快捷方式,echo alias trtpy=\"python -m trtpy\" >> ~/.bashrc
  4. 应用快捷方式:source ~/.bashrc
  5. 配置key:trtpy set-key sxaikiwik
  6. 获取并配置环境:trtpy get-env --cuda=11
    • 目前仅支持10和11,如果驱动版本不适配,会提示找不到适配的版本
  7. 自动改变配置变量:trtpy prep-vars .,把当前目录下的所有变量都自行替换
  8. 即可运行make run

Reference

  • TensorRT的B站视频讲解:https://www.bilibili.com/video/BV1Xw411f7FW
  • 官方的视频讲解:https://www.bilibili.com/video/BV15Y4y1W73E
  • trtpy前期介绍文档:https://zhuanlan.zhihu.com/p/462980738
  • 本源代码对应配套的视频教程讲解(腾讯课堂):https://ke.qq.com/course/4993141
http://www.lryc.cn/news/66427.html

相关文章:

  • Spot CEO:我们为什么选择Babylon.js而不是Three.js
  • arm安装pyrealsense
  • day36_jdbc
  • C++好难(6):模板初阶
  • Windows 10字体模糊发虚! 如何解决?
  • Spring中的Bean和Bean的生命周期
  • 嘉兴桐乡技能培训提升-如何提高工作效率
  • SystemFunction032函数的免杀研究
  • Shell函数
  • Spring-IOC源码解析
  • 不会做大数据实时计算?10年数据分析师整理,一文给出解决方案
  • 如何让你的 WebSocket 接口测试更高效?拯救你的接口测试工作
  • 浅谈Linux 文件系统层次结构的组织方式
  • 创新案例 |探索 Tive 80% 的收入增长得益于智能物流服务、跟踪和实时可视化
  • makefile和cmake
  • 通过OpenCL内核代码猜测设备寄存器个数
  • C# + .Net6 实现TensorFlow图片分类
  • Ngnix负载均衡和高可用集群及搭建与相关理论
  • 2022年宜昌市网络搭建与应用竞赛样题(三)
  • 为什么PCB设计完成后需要放置mark点
  • 代理IP:IP代理技术与Socks5协议
  • 如何让java程序员生涯更顺利?我聊聊提升技术水平的五个方面
  • 快速排序、希尔排序、归并排序、堆排序、插入排序、冒泡排序、选择排序(递归、非递归)C语言详解
  • ChatGPT一键私有部署,全网可用,让访问、问答不再受限,且安全稳定!
  • 自学黑客(网络安全),一般人我劝你还是算了吧
  • 盘“底座”,盘出新生意经
  • 《花雕学AI》Poe:一个让你和 AI 成为朋友的平台,带你探索 ChatGPT4 和其他 八种AI 模型的奥秘
  • 单片机GD32F303RCT6 (Macos环境)开发 (十五)—— i2c1采用DMA方式的读写函数
  • 通知短信 API 技术细节以及发送流程机制原理解析
  • Protobuf: 高效数据传输的秘密武器