当前位置: 首页 > news >正文

TensorRT及CUDA自学笔记003 NVCC及其命令行参数

TensorRT及CUDA自学笔记003 NVCC及其命令行参数

各位大佬,这是我的自学笔记,如有错误请指正,也欢迎在评论区学习交流,谢谢!

NVCC是一种编译器,基于一些命令行参数可以将使用PTX或C语言编写的代码编译成可执行文件。

NVCC工作流程

在这里插入图片描述

  1. NVCC分离源文件中与GPU相关的内核代码,将其编译为cubin或PTX中间文件,并保存在fatbinary中。如果源文件使用C语言编写就编译为cubin,如果源文件使用PTX语言编写就将其编译为PTX中间文件。
  2. NVCC分离源文件中与主机相关的代码,使用当前系统中的编译器(如g++)进行编译,并将fatbinary嵌入其中。
  3. 进行链接,链接CUDA运行库和用户使用的库,最后产生可执行文件。

NVCC输入文件解释

在这里插入图片描述

NVCC命令行

在这里插入图片描述
详见链接

常用的NVCC命令行参数

短名参数长名参数含义
-i–include-path用来设置头文件路径
-o–output-file指定输出文件
-l–library指定库路径
-g–debug指定debug模式
-arch–gpu-architecture指定虚拟机架构,配置PTX兼容性
-ptx设置输出ptx文件路径
-code–gpu-code设置二进制兼容性
http://www.lryc.cn/news/305602.html

相关文章:

  • 数据库管理-第154期 Oracle Vector DB AI-06(20240223)
  • 解决uni-app vue3 nvue中使用pinia页面空白问题
  • 不用加减乘除做加法
  • 旅游组团自驾游拼团系统 微信小程序python+java+node.js+php
  • LeetCode 第41天 | 背包问题 二维数组 一维数组 416.分割等和子集 动态规划
  • Ubuntu20.04和Windows11下配置StarCraft II环境
  • 【NCom】:通过高温气相合成调节Pt-CeO2相互作用以提高晶格氧的还原性
  • git 将一个分支的提交移动到另一个分支
  • vue3 实现 el-pagination页面分页组件的封装以及调用
  • #FPGA(IRDA)
  • Sora—openai最新大模型文字生成视频
  • VoIP(Voice over Internet Protocol 基于IP的语音传输)介绍(网络电话、ip电话)
  • 编程笔记 Golang基础 027 结构体
  • opencascade15解析导出为step格式
  • 【软件设计模式之模板方法模式】
  • Spring Boot项目怎么对System.setProperty(key, value)设置的属性进行读取加解密
  • Linux理解
  • 常用芯片学习——YC688语音芯片
  • C语言:指针的进阶讲解
  • 基于SSM的车位租赁系统(有报告)。Javaee项目。ssm项目。
  • Java pyhon C C++ R JS 主流语言的区别-03
  • 5 buuctf解题
  • 微服务三十五关
  • 第一个 Angular 项目 - 添加服务
  • 红日靶场3
  • B树的介绍
  • 《The Art of InnoDB》第二部分|第4章:深入结构-磁盘结构-撕裂的页面(doublewrite buffer)
  • 提示工程(Prompt Engineering)、微调(Fine-tuning) 和 嵌入(Embedding)
  • 【Flink精讲】Flink 内存管理
  • 正则化概念及使用