当前位置: 首页 > news >正文

NVIDIA 显卡硬件支持的精度模式

很多炼丹师不知道自己英伟达显卡支持哪些精度模式,本文整理了NVIDIA官网的数据,为你解开疑惑。

1. 首先了解CUDA计算能力及其支持的精度模式;

2. 查看自己显卡(或其它NVIDIA硬件)的计算能力值为多少。

表1 CUDA计算能力及其支持的精度模式

CUDA Compute
Capability
TF32FP32FP16INT8

FP16

Tensor Cores

INT8

Tensor Cores

DLA
9YesYesYesYesYesYesNo
8.9YesYesYesYesYesYesNo
8.7YesYesYesYesYesYesYes
8.6YesYesYesYesYesYesNo
8YesYesYesYesYesYesNo
7.5NoYesYesYesYesYesNo
7.2NoYesYesYesYesYesYes
7NoYesYesYesYesNoNo
6.1NoYesYesYesNoNoNo
6NoYesYesNoNoNoNo

表2 NVIDIA 硬件(包含显卡、嵌入式板卡等)对应的计算能力

GPUCompute Capability
NVIDIA H1009
NVIDIA L48.9
NVIDIA L408.9
RTX 60008.9
GeForce RTX 40908.9
GeForce RTX 40808.9
GeForce RTX 4070 Ti8.9
GeForce RTX 40708.9
GeForce RTX 40608.9
GeForce RTX 40508.9
Jetson AGX Orin8.7
Jetson Orin NX8.7
Jetson Orin Nano8.7
NVIDIA A408.6
NVIDIA A108.6
NVIDIA A168.6
NVIDIA A28.6
RTX A60008.6
RTX A50008.6
RTX A40008.6
RTX A30008.6
RTX A20008.6
GeForce RTX 3090 Ti8.6
GeForce RTX 30908.6
GeForce RTX 3080 Ti8.6
GeForce RTX 30808.6
GeForce RTX 3070 Ti8.6
GeForce RTX 30708.6
Geforce RTX 3060 Ti8.6
Geforce RTX 30608.6
GeForce RTX 3050 Ti8.6
GeForce RTX 30508.6
NVIDIA A1008
NVIDIA A308
NVIDIA T47.5
Quadro RTX 80007.5
Quadro RTX 60007.5
Quadro RTX 50007.5
Quadro RTX 40007.5
RTX 50007.5
RTX 40007.5
RTX 30007.5
T20007.5
T12007.5
T10007.5
T6007.5
T5007.5
T4007.5
GeForce GTX 1650 Ti7.5
NVIDIA TITAN RTX7.5
Geforce RTX 2080 Ti7.5
Geforce RTX 20807.5
Geforce RTX 20707.5
Geforce RTX 20607.5
Jetson AGX Xavier7.2
Jetson Xavier NX7.2
NVIDIA V1007
Quadro GV1007
NVIDIA TITAN V7
Jetson TX26.2
Tesla P406.1
Tesla P46.1
Quadro P60006.1
Quadro P52006.1
Quadro P50006.1
Quadro P42006.1
Quadro P40006.1
Quadro P32006.1
Quadro P30006.1
Quadro P22006.1
Quadro P20006.1
Quadro P10006.1
Quadro P6206.1
Quadro P6006.1
Quadro P5006.1
Quadro P4006.1
P6206.1
P5206.1
NVIDIA TITAN Xp6.1
NVIDIA TITAN X6.1
GeForce GTX 1080 Ti6.1
GeForce GTX 10806.1
GeForce GTX 1070 Ti6.1
GeForce GTX 10706.1
GeForce GTX 10606.1
GeForce GTX 10506.1
Tesla P1006
Quadro GP1006
Jetson Nano5.3

通过以上两表,可了解每个硬件支持的精度模式。

参考:

Support Matrix :: NVIDIA Deep Learning TensorRT Documentation

CUDA GPUs - Compute Capability | NVIDIA Developer

 

http://www.lryc.cn/news/167315.html

相关文章:

  • 【Java|golang】210. 课程表 II---拓扑排序
  • STM32CubeMX systick bug?
  • 徐亦达机器学习:Kalman Filter 卡尔曼滤波笔记 (一)
  • Java和vue的包含数组组件contains、includes
  • OpenCV_CUDA_VS编译安装
  • 基于减法优化SABO优化ELM(SABO-ELM)负荷预测(Matlab代码实现)
  • 记录第一个启动代码的诞生
  • 基于STM32的简化版智能手表
  • 揭秘弹幕游戏制作
  • 2327. 知道秘密的人数;1722. 执行交换操作后的最小汉明距离;2537. 统计好子数组的数目
  • 【TCPDF】使用TCPDF导出PDF文件
  • MacBook苹果电脑重装、降级系统
  • Java 解决long类型数据在前后端传递失真问题
  • IDEA的快捷键大全
  • 简单记一下Vue router 路由中使用 vue-i18n 进行标题国际化
  • 【Gitea】 Post “http://localhost:3000/api/internal/hook/pre-receive/aa/bbb“ 异常
  • 如何使用element-ui相关组件如:el-select,el-table,el-switch,el-pagination,el-dialog
  • 微信小程序+echart实现点亮旅游地图
  • Git(8)——Git命令总结
  • 9.15 滴滴笔试
  • 有趣的设计模式——适配器模式让两脚插头也能使用三孔插板
  • 2.10 PE结构:重建重定位表结构
  • 关于content-type的理解
  • <图像处理> 空间滤波基础二
  • Java中的队列Queue
  • 机器学习技术(十)——决策树算法实操,基于运营商过往数据对用户离网情况进行预测
  • 大数据之-kafka学习笔记
  • 虚幻动画系统概述
  • 什么是集成测试?集成测试方法有哪些?
  • elementUI中的el-form常用校验规则