当前位置: 首页 > news >正文

NVIDIA Jetson Nano的国产替代,基于算能BM1684X+FPGA+AI算力盒子,支持deepseek边缘部署

NVIDIA Jetson Nano的国产替代,基于算能BM1684X的AI算力盒子,支持deepseek边缘部署

另外,还提供BM1684X+FPGA+AI的解决方案。

图片

核心板基于Sophon SG2300X SoC(也叫BM1684X)打造

图片

带有8核ARM Cortex-A53 @2.3GHz,频率很高。

图片

带有TPU(张量处理器)

算力可达32TOPS@int816TFLOPS(FP16/BF16)

和2TFLOPS(FP32)

支持TensorFlow、Caffe、PyTorch、Paddle、ONNX、MXNet、Tengine、DarkNet等深度学习框架。

图片

视频处理单元(VPU)支持32路H.265/H.264 1080P@25fps解码12路编码

图片

JPEG编解码支持1080P@600fps,最大分辨率32768×32768,后处理功能涵盖图像缩放、裁剪、色彩空间转换等。

搭配16GB LPDDR4X内存,看芯片框图,似乎是四个4GB内存芯片,可能是四通道,这样的话,速度应该还可以。

图片

64GB eMMC 5.1,16MB SPI Flash

核心板通过144P的板对板连接器安装到扩展板上,引出了不少接口。
扩展板带有M.2 E Key(用于安装Wi-Fi/BT)、M.2 2230 NVMe SSD
外面有两个USB3.0 HOST接口,两个千兆网口

图片

一个USB Type-C电源接口支持PD供电,电压支持20V输入,支持20V3.25A或者更高,也就是支持65W以上的电源。

一个USB Type-C Debug UART接口,MicroSD卡槽。

工作温度0~40℃。

尺寸104×84×52mm

系统上,官方提供了两个镜像,一个是基础镜像,基于Ubuntu Server 20.04,仅包含 Sophon 基础 SDK 和后台,只有1.2GB。

还有一个基于Ubuntu Server 20.04,包含Sophon SDK和后台,预装瑞莎LLM前端,预装CasaOS,常见LLM的Demo的完整版镜像,大小来到了9.5GB。

图片

而这个AirBox的亮点也就在于预装了CasaOS,极大的的简化了部署大模型的门槛,部署各类大模型都相当轻松

图片

官方完整版镜像默认预装了Stable Diffusion

部署whisper,chatglm2 chatdoc chatbot

imagesearch,llama3也非常轻松,只需要简单几步就部署完成了,搞这些在Linux下变得轻松愉快。

你也可以自己打包Docker镜像,官方也有教程可以参考,这样之后部署这些都会变得相当简单。

而重头戏其实是本地部署LLM大语言模型,可以部署

chatglm2 chatdoc chatbot

图片

Llama3,Qwen2,DeepSeek R1
官方介绍了deepseek-r1-distill-qwen-1.5b和deepseek-r1-distill-qwen-7b两个Qwen2.5蒸馏模型的部署。

都采用的INT4量化方式,目前1.5B的模型,在AirBox上,推理速度可达30.448tokens/s7B的模型,推理速度可达11.008tokens/s

图片

Llama3 8B模型推理速度可达9.566token/s

图片

文生图大模型支持Stable Diffusion1.5Real ESRGAN,Stable Diffusion 3 Medium,FLUX.1这些模型的部署,且都能正常运行。
在Stable Diffusion1.5下生成一个512x512的图片,在7秒左右。

图片

除此之外还支持Image Search文本搜索图片Video Search文本搜索视频,向量搜索模型应用。

图片

支持Emoti VoiceWhisper这些TTS/STT模型的部署。还有MiniCPM-V2.6这个视觉多模态模型。

想要更多模型,Radxa也准备了Model-Zoo,可以部署目标检测,语义分割,人脸检测各种算法应用。

图片

Radxa还提供了TPU-MLIR编译器工具链,用于将各种不同框架下预训练的神经网络模型转化为可以在算能TPU上运行的bmodel格式模型。

可以直接支持PyTorch, ONNX, Caffe 和 TFLite。其他框架的模型需要转换为ONNX模型。

转换完之后,Radxa还提供了TPU-PERF用于TPU加载/推理经过TPU-MLIR转换好的bmodel模型

图片

http://www.lryc.cn/news/547819.html

相关文章:

  • c++全排列
  • VSCode 配置优化指南:打造极致高效的前端开发环境
  • 利用 ArcGIS Pro 快速统计省域各市道路长度的实操指南
  • CTF 中的 XSS 攻击:原理、技巧与实战案例
  • LeetCode hot 100—二叉树的最大深度
  • .h264/.h265文件 前端直接播放
  • 【单片机通信技术】串口通信的几种方式与比较,详细解释SPI通信
  • PDF转JPG(并去除多余的白边)
  • 题目 3217 ⭐成绩统计⭐【滑动窗口 + 二分搜索】蓝桥杯2024年第十五届省赛
  • URL中的特殊字符与web安全
  • 八卡5090服务器首发亮相!
  • esp32驱动带字库芯片TFT屏幕
  • 为AI聊天工具添加一个知识系统 之138 设计重审 之2 文章学 引言之2 附加符号学附属诠释学附随工程学(联系)
  • java环境部署
  • 正点原子[第三期]Arm(iMX6U)Linux移植学习笔记-2.1 uboot简介
  • CentOS 7.9 安装 ClickHouse 文档
  • 高考數學。。。
  • 使用GitLink个人建站服务部署Allure在线测试报告
  • Linux 上离线安装 python3
  • js操作字符串的常用方法
  • 自动化学习-使用git进行版本管理
  • GCC RISCV 后端 -- GCC Passes 注释
  • Ollama存在安全风险的情况通报及解决方案
  • IDEA Generate POJOs.groovy 踩坑小计 | 生成实体 |groovy报错
  • 阿里云云监控资源告警常用模板
  • Tailwind CSS 问题:npm error could not determine executable to run
  • vue基本功
  • .NET10 - 预览版1新功能体验(一)
  • java下载多个网络文件并压缩成压缩包保存到本地
  • 23种设计模式之单例模式(Singleton Pattern)【设计模式】