当前位置: 首页 > news >正文

为何说分布式 AI 推理已成为下一代计算方式

2024 年,我们见证了人工智能创新的空前爆发。AI 的快速发展令很多人惊叹,为了训练更先进的大语言模型(LLM),科技巨头争相获取强大的 GPU。如今,AI 正在无缝融入我们世界的每个角落。

image.png

在众多新兴 AI 公司、模型和应用的浪潮中,有个趋势愈发清晰:AI 的重点正在从训练转向推理。彭博社预测,到 2032 年,AI 推理市场规模将增至 1.3 万亿美元,这一观点也得到了很多最新报告的支持。市场的这一变化表明,2025 年将成为加速分布式 AI 推理发展的关键一年。

“持续改进” 和 “不断适应” 的往复循环

尽管在打造强大 AI 模型的过程中,训练工作仍将发挥关键作用,但未来的重点将会是推理:即部署这些模型,进而为企业和消费者提供实时、可行的见解和结果。同时,通过从边缘设备将动态数据回馈至训练过程,推动模型持续改进与适应,形成一个不断优化的循环。

AI 推理的应用方式

AI 推理是人工智能从 “画在纸上的饼” 转变为实际应用并产生现实影响的关键环节。Akamai 的客户正在多个行业和应用场景中利用 AI 推理,包括:

  • 智慧城市: 优化交通流量以减少拥堵并提升安全性,通过智能监控改善公共安全。
  • 自动驾驶车辆: 实现瞬时决策,促进高效的车队编排。
  • 工业物联网与制造业: 实施预测性维护以防止停机,通过实时视频分析提升质量控制。
  • 智能零售: 提供个性化购物体验,并通过智能结账和库存管理优化运营。
  • 医疗与远程医疗: 实时监测患者健康状况,通过图像处理加速医学诊断,支持先进的可穿戴设备。
  • 媒体娱乐: 定制个性化内容,实现实时视频转码和直播增强。

这些示例只是客户借助 AI 推理所能实现的广泛应用的冰山一角。随着边缘计算不断发展,预计将在各个行业看到更多创新性的应用。

AI 推理的常见挑战

这种创新也带来了一些常见挑战,包括延迟、成本和可扩展性。多年来,Akamai 始终致力于解决这些问题。

将大量通用且性能过剩的 GPU 集中在数据中心的方式,已无法满足大众对高效 AI 推理的规模化和响应速度的需求。我们需要采用全新范式,使推理架构更贴近用户,也就是要通过分布式云模型来实现。

通过分布式云模型实现 AI 推理

在采用分布式云模型提供 AI 推理时,需要考虑一些独特因素,包括:

  • 延迟与响应速度:在集中式云数据中心之间传输数据会影响用户体验,并可能导致业务机会流失。去中心化的分布式架构则可提升推理响应速度。
  • 资源约束:边缘设备在功耗、存储和计算能力方面存在限制。因此无比要通过部署轻量化、更高效的 AI 模型来实现强大的性能。
  • 安全与数据隐私:本地数据处理可减少数据在传输过程中的暴露,从而增强安全性。这对医疗、金融和政府等需遵守严格数据本地化和隐私法规的行业尤为重要。
  • 可扩展性与分布式架构:随着托管 AI 应用的分布式位置数量增加,跨网络管理和更新 AI 模型的复杂性也随之上升。因此,必须要能提供可扩展的模型部署和维护解决方案。
  • 带宽与成本效益:去中心化 AI 推理可大幅减少传输至集中式云服务器的数据量,不仅能缓解网络拥堵,还能显著降低数据传输和存储成本。

这些因素是在分布式、去中心化云基础设施上部署 AI 时的关键考量,所有希望高效利用 AI 的企业都应重点关注。

image.png

Akamai 强大生态系统带来卓越的性能和可扩展性

Akamai 致力于构建全球分布的云。我们的全球基础设施经过近 30 年发展,已容纳超过 25 个核心计算区域、快速扩展的分布式计算位置,以及超过 4000 个边缘节点。这一强大生态系统已经为满足企业在当前和未来 AI 推理需求做好了准备。

我们意识到,尽管客户对高性能有很高需求,但他们也越来越担心传统云服务商常见的高额成本超支。Akamai 云旨在解决这一日益增长的问题。

我们并没有沿袭传统做法囤积昂贵的通用 GPU,这些 GPU 对 AI 推理任务来说往往过于强大。相反,我们为客户提供了一种平衡的 GPU 替代方案:Nvidia RTX 4000 Ada 系列 GPU。这些 GPU 兼具性能和成本效益,非常适合 AI 推理、运行小型语言模型以及处理像媒体转码这样的专用工作负载。

强大但不失成本效益的方法

这种方法使我们能将卓越的 AI 能力更贴近用户,同时保持对客户的成本效益。我们的测试显示,在运行生成式 AI 类 Stable Diffusion 模型时,与传统公有云服务商提供的同类 GPU 替代方案相比,我们的成本节省幅度超过了 80%。

相信这种方法能带来最强大且兼具成本效益的结果,并能够推动新的 AI 应用场景继续发展。

分布式推理是使用 AI 的全新构想

随着 AI 的实用性不断提升,Akamai 认为:分布式推理不仅仅是技术的进步,更是对 AI 使用方式的根本性重新构想。从集中的资源密集型计算转向更高效的分布式边缘计算,这一转变已经在不知不觉中开始了。

Akamai 不仅在观察这一变革,也在积极塑造这场变革。通过将遍布全球的分布式网络、战略性的云计算投资(包括围绕推理工作进行优化的 GPU)以及对性能和成本效益的深刻理解等因素紧密结合在一起,Akamai 正专注于帮助企业释放 AI 推理的真正潜力。

很多企业也已经意识到,对于采用 AI 推理这件事,真正的问题已经不再是 “是否”,而是 “如何”。边缘不再仅仅是数据的目的地,而是正成为 AI 提供最具影响力、实时见解的主要领域。欢迎进入计算的下一世代。

http://www.lryc.cn/news/589027.html

相关文章:

  • AI-Compass LLM训练框架生态:整合ms-swift、Unsloth、Megatron-LM等核心框架,涵盖全参数/PEFT训练与分布式优化
  • 分布式通信框架 - JGroups
  • 第二阶段-第二章—8天Python从入门到精通【itheima】-129节(MySQL的安装)
  • JVM——编译执行于解释执行的区别是什么?JVM使用哪种方式?
  • 从 0 到 1 掌握 自研企业级分布式 ID 发号器
  • 【PTA数据结构 | C语言版】创建哈夫曼树
  • 【c++】c++11新特性(右值引用和移动语义)
  • 安全参綉25暑假第一次作业
  • 如何科学做好企业软件许可优化?
  • 构建 Go 可执行文件镜像 | 探索轻量级 Docker 基础镜像(我应该选择哪个 Docker 镜像?)
  • 波动回升正当时!期权合成多头:震荡市攻守兼备利器
  • 职业院校网络安全攻防对抗实训室解决方案
  • Axios 和Express 区别对比
  • 大模型在1型糖尿病肾病V期预测及治疗方案制定中的应用研究
  • 编写一个简单的riscv模拟器(三)
  • MySQL 备份与恢复指南
  • etcd压缩历史版本
  • Web3 学习路线与面试经验
  • Springboot集成SpringSecurity的介绍及使用
  • AR眼镜颠覆医疗:精准手术零误差
  • 1.1 前端-vue3项目的创建
  • vscode 打开c++文件注释乱码
  • mysql 索引失效的场景
  • 将 Vue 3 + Vite + TS 项目打包为 .exe 文件
  • SpringBoot 实现 Redis读写分离
  • 编译原理第一到三章(知识点学习/期末复习/笔试/面试)
  • 第三章 OB SQL 引擎高级技术
  • HR数字化转型:3大痛点解决方案与效率突破指南
  • B/S架构系统角色与对应协议详解
  • AAAI-2025 | 同济大学面向嘈杂环境的音频视觉导航!BeDAViN:大规模音频-视觉数据集与多声源架构研究