当前位置: 首页 > news >正文

LLM并行计算的论文

LLM并行计算的论文

基础并行计算方法相关

  • 《Gpipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism》:提出了Gpipe这种流水线并行方法,通过将数据批量进一步等分成若干microbatch,并以流水线的方式执行,减少计算中空泡的比例,极大地拓展了模型的规模,可应用于CNN和Transformer架构等,并且在设备通信等方面做了优化,有效提升了计算效率.
  • 《Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism》:实现了Transformer架构下的层内张量并行,可和数据并行、流水线并行搭配使用。其通过对Transformer单元中的两层MLP和多头自注意力模块等进行巧妙的并行划分,减少了同步通信开销,在大规模GPU集群上取得了良好的吞吐量扩展,比如在512张GPU的规模下可以取得76%的扩展效率.

特定并行策略及优化相关

  • *《Parallelized Autoregressive Visual Generation》
http://www.lryc.cn/news/511852.html

相关文章:

  • Linux 搭建 nginx+keepalived 高可用 | Nginx反向代理
  • Spring Boot 项目中 Maven 剔除无用 Jar 引用的最佳实践
  • useWhyDidYouUpdate详解
  • c++入门——c++输入cin和输出cout的简单使用
  • Spring Cloud LoadBalancer (负载均衡)
  • 微服务-1 认识微服务
  • 基于51单片机的交通灯带拐弯proteus仿真
  • 1229java面经
  • MySQL中查看表结构
  • python利用selenium实现大麦网抢票
  • FME教程:一键批量调换图斑X、Y坐标,解决因为坐标弄反了,导致GIS弹窗提示“范围不一致”警告问题
  • OpenCV-Python实战(4)——图像处理基础知识
  • 音视频入门基础:MPEG2-PS专题(1)——MPEG2-PS官方文档下载
  • Qt自定义步骤引导按钮
  • 贝叶斯神经网络(Bayesian Neural Network)
  • Direct Preference Optimization: Your Language Model is Secretly a Reward Model
  • 如何通过 Kafka 将数据导入 Elasticsearch
  • 嵌入式系统 第十二讲 块设备和驱动程序设计
  • 攻防世界web第六题upload
  • 人工智能-Python网络编程-HTTP
  • 探索仓颉编程语言:功能、实战与展望
  • Unity-Editor扩展显示文件夹大小修复版 FileCapacity.cs
  • BLE core 内容整理解释
  • Linux CPU调度算法
  • Linux套接字通信学习
  • mybatis-plus 用法总结
  • 小程序配置文件 —— 14 全局配置 - tabbar配置
  • Redis-十大数据类型
  • linux系统编程(七)管道和FIFO
  • 【vLLM大模型TPS测试三部曲】