当前位置: 首页 > news >正文

训推一体 | 暴雨X8848 G6服务器 x Intel®Gaudi® 2E AI加速卡

近日,暴雨信息携手英特尔,针对Gaudi® 2E AI加速器HL-288 PCIe卡(简称Intel®Gaudi® 2E PCIe卡,下同)完成专项调优与适配工作,并重磅推出Intel Eagle Stream平台4U8卡解决方案。该方案通过软硬件协同优化,显著提升深度学习训练与推理性能,尤其在大模型训练、高内存容量需求及实时推理等高强度场景中表现突出,可充分满足行业对高效AI计算的核心诉求。

而Intel®Gaudi® 2E PCIe卡基于Habana Gaudi2架构设计,面向数据中心和企业级AI工作负载优化,旨在提供高性能、高效率的生成式AI计算。

该卡配备96 GB大容量内存,其先进的HBM控制器针对随机访问和线性访问场景进行了深度优化,在各种访问模式下可提供高内存带宽,有效避免因显存不足造成AI训练或推理任务的延迟问题,保障计算流程的流畅性。在扩展性方面,该卡表现尤为突出:单卡原生集成24个50GbE RoCE v2 RDMA端口,通过配套的四卡全连接板,可对四张PCIe卡进行全连接,提升多卡互联性能。全连接板与每张PCIe卡内18个50Gbps口相连,实现四张卡两两互联300Gbps的通信带宽。

同时,该卡基于Intel的可编程TPC和GEMM引擎,融合了诸多技术创新,支持各种面向AI级的高级数据类型,如FP8/BF16/PF16/TF32和FP32。通过外接网卡,实现横向扩展,以满足多节点集群的需要。

据最新实测数据显示,X8848 G6服务器:搭配8张Intel®Gaudi® 2E PCIe卡,运行DeepSeek-R1-671B模型,在输入/输出token长度均为1k,多用户并发数为32的条件下,单并发Token生成效率达11 Tokens/s,可满足企业级私有化部署。搭配2张Intel®Gaudi® 2E PCIe卡,运行DeepSeek-R1-Distill-Qwen-32B模型,在输入/输出token长度均为1k、多用户并发数为32的条件下,单并发Token生成效率达20 Tokens/s,可满足AI推理(知识库)一体化应用。

在AI算力需求爆发的当下,暴雨信息X8848 G6服务器Intel®Gaudi® 2E AI加速卡的强强联合,正是精准呼应 “训推一体” 的高效算力需求—— 从模型训练的深度突破到推理部署的实时响应,其全能表现将切实助力各行各业加速 AI 技术落地与价值释放。若您想了解更多适配场景、性能数据或定制化方案,欢迎联系交流,我们将为您提供更详尽的技术解读与全流程支持,让高效AI算力真正转化为业务增长的强劲引擎。

http://www.lryc.cn/news/617916.html

相关文章:

  • 【k近邻】 K-Nearest Neighbors算法k值的选择
  • es基本概念-自学笔记
  • Java多线程并发控制:使用ReentrantLock实现生产者-消费者模型
  • Redis中的AOF原理详解
  • 在 Linux 中通过 yum 安装和使用 Nginx
  • OrbStack 入门教程:macOS 上的轻量级容器与虚拟机管理工具
  • vue+django 大模型心理学智能诊断评测系统干预治疗辅助系统、智慧心理医疗、带知识图谱
  • 基于8×8 DCT变换的图像压缩MATLAB实现
  • 云服务器部署SSM项目
  • Kubernetes生产环境健康检查自动化指南
  • 7.Java的继承
  • 北京朝阳区中小学生信息学竞赛选拔赛C++真题
  • 左子树之和
  • 【数据可视化-86】中国育儿成本深度可视化分析(基于《中国统计年鉴2023》数据):用Python和pyecharts打造炫酷可视化大屏
  • 矩阵游戏(二分图最大匹配)
  • (3万字详解)Linux系统学习:深入了解Linux系统开发工具
  • MCU中的存储器映射(Memory Map)
  • Docker 网络-单机版
  • 在 .NET Core 5.0 中启用 Gzip 压缩 Response
  • js异步操作 Promise :fetch API 带来的网络请求变革—仙盟创梦IDE
  • Qwen2.5-vl源码解读系列:ImageProcessor
  • Android14 QS编辑页面面板的加载解析
  • Android中Activity销毁底层原理
  • GSON 框架下百度天气 JSON 数据转 JavaBean 的实战攻略
  • Mysql——Sql的执行过程
  • 从 0 到 1:用 MyCat 打造可水平扩展的 MySQL 分库分表架构
  • Linux-常用命令
  • 深入解析 resolv.conf 文件:DNS 配置的核心
  • 驱动_ConfigFS多级目录操作
  • 光功率dBm为何是负数?一文详解