当前位置: 首页 > news >正文

AI嵌入式全景:各厂商、系列和开发工具的综合概览

要看几个方面
1 算力
2 支持何种模型
3 是否支持可视化的窗口系统

一般而言各个平台均采用linux操作系统,官方提供对应SDK,安装好后可使用硬件加速资源。
而且如果要使用其硬件加速,一般都要完成模型转换,将模型转为该平台所特有的格式。平台的SDK会提供转换工具。

深度学习加速单元NPU

平台一般为异构,即CPU(一般为arm结构)和加速单元。

NPU 是什么

NPU(神经处理单元)是一种专门设计用于加速人工神经网络(ANN)和深度学习任务的硬件组件。它是一种特定于AI(人工智能)和机器学习工作负载的处理单元,通常用于执行神经网络的前向传播和推断操作。NPU的设计旨在高效地执行矩阵乘法、卷积运算和其他深度学习操作,以加快模型训练和推理的速度。

NPU通常与中央处理单元(CPU)和图形处理单元(GPU)协同工作,以提供更高的性能和能效,特别是在需要大规模深度学习模型的应用中,如计算机视觉、自然语言处理和语音识别等领域。各种芯片制造商和硬件供应商都推出了自己的NPU解决方案,以满足不同应用场景的需求。

总之,NPU是专门设计用于加速深度学习任务的硬件单元,旨在提高模型训练和推理的速度和效率。它在人工智能和机器学习领域具有重要的应用前景。

NPU(神经处理单元)通常被用作一个统称,而不是一个特定的硬件架构。它描述了一种专门设计用于加速神经网络和深度学习任务的硬件处理单元的概念。

加速单元如下:

CPU、GPU、TPU、NPU等到底是什么?

官网能查询到参数,但一般都是处理器或者核心板的参数,开发板的外围接口信息要问具体商家。
算力可以去硕士论文里找找看,一般以某个网络为基准,比如看看yolov3在该平台耗时多久

1.GPU

  • 厂家:NVIDIA link

  • Jetson AGX Orin 系列

  • Jetson Orin NX 系列

  • Jetson Orin Nano 系列

  • Jetson AGX Xavier 系列

  • Jetson Xavier NX 系列

  • Jetson TX2 系列

  • Jetson Nano

  • IGX 平台

开发工具

平台特有模型为TensorRT,可将ONNX模型转为TensorRT。无论是pytorch还是tensorflow还是caffe都能转为ONNX。

开发板一般支持可视化的操作系统

2.FPGA

FPGA 是一种硬件可重构的体系结构。它的英文全称是Field Programmable Gate Array,中文名是现场可编程门阵列。这个东西算力很强,但是价格贵。

  • 厂家:xilinx

  • Versa AI Edge 系列 link

  • Versa AI Core link

  • UltraScale 系列link link

型号很多,命名很奇怪,名字一般不带系列名,而是A** V** K**

开发工具

Vitis AI(以前称为DNNDK):Vitis AI是Xilinx的一个工具套件,支持将深度学习模型部署到Xilinx的FPGA和ACAP硬件平台上。它可以用于部署ONNX、PyTorch、TensorFlow和Caffe等框架训练的模型。Vitis AI提供了模型优化、量化、编译和部署的工具,以实现高性能的硬件加速。

Vitis:Vitis是Xilinx的软件开发环境,它包括针对FPGA的高级综合(High-Level Synthesis,HLS)工具。开发人员可以使用Vitis来实现自定义的硬件加速器,以支持各种深度学习框架。

PetaLinux:PetaLinux是Xilinx的嵌入式Linux解决方案,它可以与深度学习库和工具集成,以支持将深度学习模型部署到Xilinx的嵌入式硬件平台上

开发板一般不支持可视化的操作系统,但我记得那么几款是支持的,但是很贵。

改天补充,今天先到这里了,要查的资料挺多的

3.VPU

4.TPU

5.BPU

6.DPU IPU NNIE

其他厂商

寒武纪、百度、瑞芯微、海思晟腾、firefly

http://www.lryc.cn/news/135138.html

相关文章:

  • mysql Left Join on条件 where条件的用法区别
  • Redis中的淘汰策略
  • MyBatis进阶:掌握MyBatis动态SQL与模糊查询、结果映射,让你在面试中脱颖而出!!
  • C++ 写入txt文件内容并追加内容
  • Leetcode---359周赛
  • Keras三种主流模型构建方式:序列模型、函数模型、子类模型开发实践,以真实烟雾识别场景数据为例
  • objective-v 获取iPhone系统当前时间字符串适配12小时制和24小时制
  • 并查集及其简单应用
  • 基于web的服装商城系统java网上购物商店jsp源代码mysql
  • .NET Core发布到IIS
  • Spring的基本概念
  • 设计模式之原型模式
  • 正则表达式在网页处理中的应用四则
  • ping使用方法
  • “心理健康人工智能产学研创新联盟”揭牌成立|深兰科技
  • FastDFS+Nginx - 本地搭建文件服务器同时实现在外远程访问「端口映射」
  • Mybatis-动态sql和分页
  • 基于YOLOV8模型的西红柿目标检测系统(PyTorch+Pyside6+YOLOv8模型)
  • 数学建模及数据分析 || 4. 深度学习应用案例分享
  • 数据分析15——office中的Excel基础技术汇总
  • C语言好题解析(四)
  • 英语——主谓一致
  • 属性字符串解析
  • 【C++初阶】vector容器
  • ThreadLocal深度解析
  • 06有监督学习——迁移学习
  • 快速连接服务器脚本 可从多个服务中选择并连接
  • MemSeg:一种差异和共性来检测图像表面缺陷的半监督方法
  • 迈向未来的大门:人脸识别技术的突破与应用
  • Vue-9.集成(.editorconfig、.eslintrc.js、.prettierrc)