当前位置: 首页 > news >正文

集合通讯概览

在这里插入图片描述

集合通信概览

在这里插入图片描述

在这里插入图片描述
(1)通信的算法 是根据通讯的链路组成的
(2)因为通信链路 跟硬件强相关,所以每个CCL的库都不一样

芯片与芯片、不同U之间是怎么通信的

在这里插入图片描述
在这里插入图片描述


多卡训练:多维并行(xxx并行在上一期已经讲述过…)

在这里插入图片描述


计算与通信解耦

在这里插入图片描述


计算与通信解耦:分布式加速库

在这里插入图片描述


☆☆☆ 从加速库 -> NPU 的执行过程

在这里插入图片描述

(1)硬件的排布 跟 组网拓扑、XCCL 非常的强相关;XCCL 跟 网络拓扑 强相关
(2)分布式加速库:MindSpeed
(3)在计算的时候,用户调用pytorch等AI框架,计算在单机里面就用到了AI的框架了,
(4)在通信的时候,就会把一些张量放到一些桶里面,当桶满的时候/满足某些条件的时候,MindSpeed加速库 就会控制张量 什么时候去调用集合通信库的接口/源语 P2P all2all 相关的内容
(5)

在这里插入图片描述

(1)XCCL跟链路层、物理层强相关,所以各个公司都有自己的XCCL;
(2)具体XCCL实现了什么功能呢?---- 参照《XCCL、NCCL、HCCL通信库》
(2)all2all 等相关的接口还是保持跟NCCL一致,方便用户调用


通信算法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

不同AI时期对通讯的诉求

在这里插入图片描述

在这里插入图片描述


大模型对AI集群训练的诉求:大带宽、强同步

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


集合通讯的难点

在这里插入图片描述

http://www.lryc.cn/news/531101.html

相关文章:

  • 【FreeRTOS 教程 八】直达任务通知
  • Ubuntu 18.04安装Emacs 26.2问题解决
  • nodejs:js-mdict 的下载、安装、测试、build
  • CSS关系选择器详解
  • Python在线编辑器
  • 蓝桥杯备考:高精度算法之除法
  • 笔试-业务逻辑4
  • 《Linux服务与安全管理》| 数据库服务器安装和配置
  • 麦芯 (MachCore) 应用开发教程 6:一台设备中多台电脑主从机的设置
  • RAG 与历史信息相结合
  • 99,[7] buuctf web [羊城杯2020]easyphp
  • BUUCTF_[安洵杯 2019]easy_web(preg_match绕过/MD5强碰撞绕过/代码审计)
  • Vue05
  • ubuntu18.04环境下,Zotero 中pdf translate划线后不翻译问题解决
  • 基于Python的简单企业维修管理系统的设计与实现
  • 【C++】B2120 单词的长度
  • 2501,编写dll
  • 【router路由的配置】
  • 算法基础——一致性
  • 刷题记录 动态规划-6: 62. 不同路径
  • docker直接运行arm下的docker
  • 014-STM32单片机实现矩阵薄膜键盘设计
  • Sentinel 断路器在Spring Cloud使用
  • [内网安全] 内网渗透 - 学习手册
  • 算法总结-二分查找
  • 基于python的Kimi AI 聊天应用
  • 动手学深度学习-3.2 线性回归的从0开始
  • Spring 面试题【每日20道】【其二】
  • 嵌入式八股文面试题(一)C语言部分
  • Vue06