当前位置: 首页 > news >正文

移远通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速端侧AI落地

近日,国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势,迅速风靡全球。移远通信基于边缘计算模组SG885G,已成功实现DeepSeek模型的稳定运行,并完成了针对性微调。

目前,该模型正在多款智能终端上进行深入测试与优化。移远通信将凭借其卓越的工程化能力,加速端侧AI技术在各行各业的规模化应用与普及。

DeepSeekAI模型创新先锋

DeepSeek之所以火爆全球,源于其在模型架构、蒸馏技术以及强化学习等方面的突破性创新。

完整版DeepSeek-V3模型采用创新的MoE(混合专家)架构,拥有6,710亿参数,每秒可处理60个Token,擅长处理长文档分析、多模态推理等复杂任务和高精度场景。其每层包含256个路由专家和1个共享专家,每个Token仅激活8个专家,极大地提升了学习效率和灵活性,显著降低了训练和推理成本,同时加速了Tokens生成。

为解决小推理模型Self-play学习的不足,DeepSeek-R1通过高效蒸馏技术,将大模型的推理能力迁移到更小、更高效的版本中。这一突破使其小尺寸版本在保持卓越性能的同时,显著降低了模型体积和计算资源需求,成为端侧部署的理想选择。

同时,DeepSeek-R1-Zero实验性版本证明了仅通过强化学习(Reinforcement Learning,RL)、无需监督式微调,大模型也能具备强大的推理能力,为AI模型的训练开辟了新思路。

DeepSeek小尺寸版本:端侧部署的理想选择

DeepSeek-R1版本专注于强化学习技术路线,推理能力强、性价比突出,基于该版本开发的系列小尺寸蒸馏模型,参数范围覆盖1.5B至70B,为开发者提供了高性能、低成本的大模型部署与开发解决方案,将有力推动端侧AI的商业化应用。

简化后的小模型从大模型中继承了强大的AI能力,尽管参数量减少,但性能依然出色。由于计算量大幅降低,减少了内存和计算资源的消耗,因此特别适合资源有限的端侧设备。同时,推理速度显著提升,能够满足端侧设备对实时性的需求。此外,小模型体积更小,适配性更强,更容易在各种行业终端和边缘计算设备上集成和运行。尽管模型压缩,但通过蒸馏技术,小模型仍能保持较高的精度,确保任务效果不受影响。

移远通信:以领先的工程能力加速端侧AI落地

在众多厂商仍在探索如何支持DeepSeek模型之际,移远通信已率先取得突破,其搭载高通QCS8550平台的边缘计算模组SG885G,成功实现了DeepSeek-R1蒸馏小模型的稳定运行。实测数据显示,其生成Tokens的速度超过每秒40个Tokens,且未来随着性能的不断优化,速度还将进一步提升,为智能终端设备带来更强大的AI能力。

同时,移远通信还与行业合作伙伴紧密合作,在机器人、智能座舱、智能工业等客户应用上开展深入测试与优化,为用户提供更为流畅的AI体验。

搭载DeepSeek模型的移远边缘计算模组和解决方案,不仅适用于消费类和工业类机器人领域,还可广泛应用于智能座舱、机器视觉、个性化虚拟助理、平板电脑、老人监护、智能家居、AI玩具及可穿戴设备等多元化场景,为各行业提供强大的AI赋能,例如更自然的语音交互、更精准的图像识别以及更加个性化的服务体验。

此外,在成功实现DeepSeek模型端侧运行的基础上,移远通信还完成了该模型的针对性微调,并应用于自身的大模型解决方案中,为客户提供更精准、更高效的端侧AI服务。这一成果不仅彰显了移远通信在端侧AI领域的技术实力,更体现了其领先的工程化能力,将有力推动AIoT应用的快速发展与落地。

面向亟待接入AI能力的广泛垂直领域,移远通信将持续投入资源,推动更多高、中、入门级边缘计算模组,以及智能座舱、5G、LTE模组和解决方案全面接入DeepSeek等先进模型以及云端大模型,助力物联网设备实现智能化升级,开启万物智联新时代。

http://www.lryc.cn/news/536957.html

相关文章:

  • Cables Finance 构建集成LST与外汇RWA永续合约的综合性DEX
  • AI大模型(DeepSeek)科研应用、论文写作、数据分析与AI绘图学习
  • 【算法工程】解决linux下Aspose.slides提示No usable version of libssl found以及强化推理模型的短板
  • 什么是HTTP和HTTPS?它们之间有什么区别?
  • 【一文读懂】TCP与UDP协议
  • 数据结构 树的存储和遍历
  • Jenkins项目CICD流程
  • EasyRTC轻量级SDK:智能硬件音视频通信资源的高效利用方案
  • AI Agent未来走向何方?
  • Visual Studio Code的键盘快捷键
  • 【Jenkins流水线搭建】
  • PHP 基础介绍
  • DeepSeek如何重塑我的编程学习:计算机新生的AI实践
  • spring boot和spring cloud的关系
  • ThreadLocal原理和存在问题
  • 用Echarts的柱状图实现圆柱体效果
  • Docker 常用命令基础详解(一)
  • Java并发中的CAS机制:原理、应用与挑战(通俗易懂版)
  • 腾讯发布混元-3D 2.0: 首个开源高质3D-DiT生成大模型
  • 【机器学习】线性回归与一元线性回归
  • 哈希表-两个数的交集
  • 望远镜成像系统--科学评价光学镜头
  • 服务器延迟给视频网站造成的影响
  • C++算法竞赛基础语法-9
  • 国产编辑器EverEdit - 极简追梦人的福音:迷你查找
  • Flutter 异步编程利器:Future 与 Stream 深度解析
  • 数据结构 day05
  • 股票数据接口API实例代码python、JAVA等多种语言演示免费获取实时数据、历史数据、CDMA、KDJ等指标数据配有API说明文档
  • 【Map vs Set】:Java数据存储的“双子星”对决
  • ollama+langchain+deepseek本机跑通大模型