当前位置：首页 > news >正文

LLM并行计算的论文

news 2025/8/8 14:00:57

LLM并行计算的论文

基础并行计算方法相关

《Gpipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism》：提出了Gpipe这种流水线并行方法，通过将数据批量进一步等分成若干microbatch，并以流水线的方式执行，减少计算中空泡的比例，极大地拓展了模型的规模，可应用于CNN和Transformer架构等，并且在设备通信等方面做了优化，有效提升了计算效率.
《Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism》：实现了Transformer架构下的层内张量并行，可和数据并行、流水线并行搭配使用。其通过对Transformer单元中的两层MLP和多头自注意力模块等进行巧妙的并行划分，减少了同步通信开销，在大规模GPU集群上取得了良好的吞吐量扩展，比如在512张GPU的规模下可以取得76%的扩展效率.

特定并行策略及优化相关

*《Parallelized Autoregressive Visual Generation》

http://www.lryc.cn/news/511852.html

相关文章：

Linux 搭建 nginx+keepalived 高可用 | Nginx反向代理

Spring Boot 项目中 Maven 剔除无用 Jar 引用的最佳实践

useWhyDidYouUpdate详解

c++入门——c++输入cin和输出cout的简单使用

Spring Cloud LoadBalancer （负载均衡）

微服务-1 认识微服务

基于51单片机的交通灯带拐弯proteus仿真

MySQL中查看表结构

python利用selenium实现大麦网抢票

FME教程：一键批量调换图斑X、Y坐标，解决因为坐标弄反了，导致GIS弹窗提示“范围不一致”警告问题

OpenCV-Python实战（4）——图像处理基础知识

音视频入门基础：MPEG2-PS专题（1）——MPEG2-PS官方文档下载

Qt自定义步骤引导按钮

贝叶斯神经网络（Bayesian Neural Network）

Direct Preference Optimization: Your Language Model is Secretly a Reward Model

如何通过 Kafka 将数据导入 Elasticsearch

嵌入式系统第十二讲块设备和驱动程序设计

攻防世界web第六题upload

人工智能-Python网络编程-HTTP

探索仓颉编程语言：功能、实战与展望

Unity-Editor扩展显示文件夹大小修复版 FileCapacity.cs

BLE core 内容整理解释

Linux CPU调度算法

Linux套接字通信学习

mybatis-plus 用法总结

小程序配置文件 —— 14 全局配置 - tabbar配置

Redis-十大数据类型

linux系统编程（七）管道和FIFO

【vLLM大模型TPS测试三部曲】