当前位置: 首页 > news >正文

CUDA 参考文章

CUDA:NVCC编译过程和兼容性详解_nvcc把cuda代码转换成什么-CSDN博客icon-default.png?t=O83Ahttps://blog.csdn.net/fb_help/article/details/80462853

1、CUDA:NVCC编译过程和兼容性详解

 

CUDA:NVCC编译过程和兼容性详解
https://codeyarns.com/2014/03/03/how-to-specify-architecture-to-compile-cuda-code/
https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#supported-phases

CUDA:NVCC编译过程和兼容性详解
前言
编译流程
一些基础知识
        GPU的“代”
        GPU的小“代”
应用程序的兼容性
        虚拟架构
        真实架构
提高兼容性的方式
        即时编译(Just-In-Time)
        Fatbinaries
–generate-code
        CUDA程序兼容性
总结
————————————————

                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                        
原文链接:https://blog.csdn.net/fb_help/article/details/80462853

2、CUDA学习入门(二)(CUDA编译过程 & CUDA 线程层次)

虚拟架构代号    真实架构代号    CUDA支持版本    支持架构    支持硬件
compute_50    sm_50    CUDA 6~11    Maxwell    Tesla/Quadro M series
compute_52    sm_52    CUDA 6~11    Maxwell    GTX-980, GTX Titan X
compute_53    sm_53    CUDA 6~11    Maxwell    Tegra TX1, Jetson Nano
compute_60    sm_60    CUDA 8    Pascal    Tesla P100
compute_61    sm_61    CUDA 8    Pascal    GTX 1080, GTX1070
compute_62    sm_62    CUDA 8    Pascal    Jetson TX2
compute_70    sm_70    CUDA 9    Volta    Tesla V100
compute_72    sm_72    CUDA 9    Volta    Jetson AGX Xavier
compute_75    sm_75    CUDA 10    Turing    RTX 2080, RTX 2070 Tesla T4
compute_80    sm_80    CUDA 11.1    Ampere    A100
compute_86    sm_86    CUDA 11.1    Ampere    RTX 3090
compute_87    sm_87    CUDA 11.1    Ampere    Jetson AGX Orin
compute_89    sm_89    CUDA 11.8    Lovelace    RTX 4090
compute_90    sm_90    CUDA 12    Hopper    H100 H200
compute_95    sm_95    CUDA 12    Blackwell    B100
————————————————

我这里介绍的CUDA代码编译过程较为笼统,只是对大的过程进行概括,更加细节的可以参考下面这位大佬的文章:

https://blog.csdn.net/fb_help/article/details/80462853


                        
原文链接:https://blog.csdn.net/weixin_44222088/article/details/135716596

http://www.lryc.cn/news/453541.html

相关文章:

  • 强缓存和协商缓存的区别
  • 工控系统组成与安全需求分析
  • C(十三)for、while、do - while循环的抉择 --- 打怪闯关情景
  • 【Android 源码分析】Activity生命周期之onStop-2
  • SpringCloudStream+RocketMQ多topic
  • 随记 前端框架React的初步认识
  • 数据结构 ——— 单链表oj题:链表分割(带哨兵位单向不循环链表实现)
  • 华为 HCIP-Datacom H12-821 题库 (32)
  • [C++][第三方库][brpc]详细讲解
  • Python-Learning
  • 如何让 Android 的前端页面像 iOS 一样“优雅”?
  • 10.3学习
  • Shell文本处理(三)
  • 5个python多线程简单示例
  • Streamlit:用Python快速构建交互式Web应用
  • 深入浅出Vue.js组件开发:从基础到高级技巧
  • Python并发编程挑战与解决方案
  • LeetCode从入门到超凡(五)深入浅出---位运算
  • 一些 Go Web 开发笔记
  • [Go语言快速上手]初识Go语言
  • 基于STM32的智能风扇控制系统设计
  • OpenCV 形态学相关函数详解及用法示例
  • Kafka学习笔记(三)Kafka分区和副本机制、自定义分区、消费者指定分区
  • 华为 HCIP-Datacom H12-821 题库 (31)
  • 占位,凑满减
  • SpringBoot校园资料平台:从零到一的构建过程
  • czx前端
  • Perforce演讲回顾(上):从UE项目Project Titan,看Helix Core在大型游戏开发中的版本控制与集成使用策略
  • 【含文档】基于Springboot+Andriod的成人教育APP(含源码+数据库+lw)
  • CentOS7系统配置Yum环境