当前位置: 首页 > news >正文

端侧推理软件栈

目前单个嵌入式设备算力不足以训练模型,运行大语言模型进行推理算力也是很吃紧的。嵌入式设备上可以部署轻量模型推理软件栈。

如何构建嵌入式设备模型软件栈:

1、构建自己的模型文件格式。

2、构建python,c接口库,提供模型构建工具集,模型推理接口库等。

3、支持TensorFlow,PyTorch,ONNX等模型,并提供工具将这些模型转换成自己的模型,而且提供工具分析自己的模型。

4、提供模型评估工具,支持精度评估,性能评估,内存评估等。

5、支持推理,量化,稀疏,矩阵运算,自定义算子,动态shape,数据排布等特性和功能,支持NPU/GPU/CPU调度,Cache管理等硬件管理,支持图级别/算子级别/内存优化等优化机制和流程。

6、算子可以运行在CPU上(可用SVE,NEON指令扩展等优化性能),可以运行在GPU,NPU,TPU上,其中TPU是谷歌自研的。

7、端侧使用GPU运行算子可以用OpenGL,OpenCL,Vulkan等库,MNN,NCNN是对这些库进行了封装。在NPU上运行算子需要使用专用的NPU软件栈,ARM的NPU软件栈是ARM NN。

http://www.lryc.cn/news/590766.html

相关文章:

  • AI时代基础入门
  • Web3:Solidity入门到精通
  • Wi-Fi 渗透测试 – 第一部分(网络基础)
  • Linux运维新手的修炼手扎之第20天
  • 近期学习总结
  • 求不重叠区间总和最大值
  • 16路串口光纤通信FPGA项目实现指南 - 第二部分(下)
  • 3.1 认识函数
  • ESP32——基于idf框架开发GPIO设备
  • OJ题目里面的复杂图形的输出类型的汇总展示(巧妙地利用对称性offset偏移量)
  • 【Linux】基本指令学习1
  • DL00294-2D图像空间中3D点云分割Delaunay三角剖分
  • spring-ai之工具调用(Tool Calling)
  • TCP 拥塞控制算法 —— 慢启动(Slow Start)笔记
  • 能行为监测算法:低成本下的高效管理
  • AlpineLinux的用户管理
  • 同态加密赋能大模型医疗文本分析:可验证延迟压缩的融合之道
  • MPPT电路设计
  • LVS集群调度器
  • 解决容器dns问题
  • LVS四种模式及部署NAT、DR模式集群
  • Liunx-Lvs配置项目练习
  • Python函数全解析
  • 横向移动(中)
  • 使用YOLOv11实现水果类别检测:从数据到模型训练的全过程
  • 每日钉钉API探索:getAuthCode实现免登授权
  • 测试工作中的质量门禁管理
  • Maven入门指南:生命周期、阶段和执行顺序详解
  • 基于FPGA的IIC控制EEPROM读写(1)
  • 项目流程管理系统使用建议:推荐13款