当前位置: 首页 > news >正文

2022年6月 Frontier 获得性能第一的论文翻译

为百万兆级加速架构做高性能 Linpack 优化

摘要


我们详细叙述了在 rocHPL 中做的性能优化,rocHPL 是 AMD 对 HPL 基准的开源实现,主要是针对节点进行优化的架构,是为百万兆级系统而设计的,比如:Frontier suppercomputer。
这个实现充分利用了节点上的使用高吞吐量的 GPU 加速器的高度优化的线性代数库,同时也使用了全部的CPU槽,执行延时敏感的分解阶段。
我们详述了难能可贵的性能挺高,例如一个多线程的方法在CPU 上计算 panel 的分解阶段,再例如,多个阶段之间分享节点上的 CPU 核的时间,再例如有几个优化用来隐藏 MPI 通信的时间。
我们展示了这个 HPL 基准的实现的性能结果,既在橡树岭国家实验室的Frontier 抢先体验版集群的单节点上进行了测试,也扩展到多节点上进行了测试。

1,简介


在2022年6月,坐落在 橡树岭国家实验室的 Frontier 超级计算机,首次亮相在超级计算机 Top500 名单榜,并且以HPL 基准 1.1EFLOPS的成绩位居榜首。 分数是上一届榜首的两倍多,Frontier 是第一个在 HPL 基准分数上超过 1 EFLOPS 的超级计算机,这使得它成为第一个 百万兆计算机。不久之后,AMD就将 rocHPL 开源了,大家都可以自由获得。
rocHPL 的一个变体,优化了通信性能,由 HPE 提供,在 Frontier 上面获得了超过 1EFLOPS 的分数。
在这篇论文中,我们详述这些性能优化的大部分,来帮助达到这个分数,我们希望这些优化能够提供有用的信息来帮助 用户 在异构系统上优化 HPL。

HPL是众多基准测试中的一个,用来衡量计算机系统某些方面的性能。

http://www.lryc.cn/news/451006.html

相关文章:

  • B2B商城交易解决方案:赋能企业有效重塑采购与销售新生态
  • 初始C语言(五)
  • mysql学习教程,从入门到精通,SQL 修改表(ALTER TABLE 语句)(29)
  • 【网络基础】网络常识快速入门知识清单,看这篇文章就够了
  • OceanBase 关于一号表笔记与ERROR 1060(42S21)问题
  • 【四】Spring Cloud OpenFeign原理分析
  • EDM平台大比拼 用户体验与营销效果双重测评
  • 开卷可扩展自动驾驶(OpenDriveLab)
  • 基于大数据的二手电子产品需求分析及可视化系统
  • SpringBoot——基础配置
  • Android OpenGLES2.0开发(三):绘制一个三角形
  • 数据清洗的重要性与方法
  • AI与大数据的结合:如何从海量数据中提取价值
  • 【漏洞复现】孚盟云oa AjaxSendDingdingMessage接口 存在sql注入漏洞
  • 【VUE】案例:商场会员管理系统
  • IDEA 最新版创建 Sping Boot 项目没有 JDK8 选项的解决方案
  • Unity Asset Store的默认下载位置及更改下载路径的方法
  • ArcEngine实现要素坐标转换:平移、缩放、旋转(批量处理)
  • Redis: 主从复制原理
  • PostgreSQL 向量扩展插件pgvector安装和使用
  • 【论文阅读】基于真实数据感知的模型功能窃取攻击
  • 线程池:线程池的实现 | 日志
  • 海信和TCL雷鸟智能电视的体验
  • 自动化学习3:日志记录及测试报告的生成--自动化框架搭建
  • 【STM32单片机_(HAL库)】4-1【定时器TIM】定时器中断点灯实验
  • Linux编译安装Mysql笔记
  • 在java后端发送HTTPClient请求
  • 【STM32单片机_(HAL库)】4-3-2【定时器TIM】测量按键按下时间1——编程实现捕获功能
  • MySQL:2059 - Authentication plugin ‘caching_sha2_password‘ cannot be loaded
  • 【JavaSE】反射、枚举、lambda表达式