当前位置: 首页 > news >正文

2025秋招NLP算法面试真题(十九)-大模型分布式训练题目

目录:

  1. 理论篇
    1.1 训练大语言模型存在问题?
    1.2 什么是点对点通信?
    1.3 什么是集体通信?
    1.4 什么是数据并行?
    1.5 数据并行如何提升效率?
    1.6 什么是流水线并行?
    1.7 什么是张量并行 (intra-layer)?
    1.8 数据并行 vs 张量并行 vs 流水线并行?
    1.9 什么是3D并行?
    1.10 想要训练1个LLM,如果只想用1张显卡,那么对显卡的要求是什么?
    1.11 如果有N张显存足够大的显卡,怎么加速训练?
    1.12 如果显卡的显存不够装下一个完整的模型呢?
    1.13 PP推理时,是一个串行的过程,1个GPU计算,其他空闲,有没有其他方式?
    1.14 3种并行方式可以叠加吗?
    1.15 Colossal-AI 有1D/2D/2.5D/3D,是什么情况?
    1.16 除了3D并行有没有其他方式大规模训练?
    1.17 有了ZeRO系列,为什么还需要3D并行?
    1.18 平民适不适合玩3D并行?
    1.19 平民适不适合直接上多

http://www.lryc.cn/news/433812.html

相关文章:

  • 线程池的应用
  • OPenCV结构分析与形状描述符(5)查找图像中的连通组件的函数connectedComponents()的使用
  • HCIA--实验十三:VLAN间通信子接口实验/双单臂路由实验
  • AIStarter市场指南:项目分享与框架优化【AI绘画、写作、对话、办公、设计】
  • 机器学习第8章 集成学习
  • 京东鸿蒙上线前瞻——使用 Taro 打造高性能原生应用
  • day2 QT
  • JS_函数声明
  • 快速排序+归并排序代码回顾
  • DBC中一种特殊的特殊的Signal—多路复用Signal
  • 前端基础面试题·第三篇——JavaScript(其三)
  • MacBook真的不能打游戏吗?Mac打游戏会损坏电脑吗?苹果电脑怎么玩游戏
  • 安卓逆向(之)真机root(红米手机)
  • 关于转行网络安全的一些建议
  • (六十五)第 10 章 内部排序(希尔排序)
  • 802.11 中 scrambler的matlab仿真
  • centos 服务器 多网卡 ip 地址 设置
  • 什么是大数据、有什么用以及学习内容
  • ZBrush与Blender雕刻功能哪个更好些?
  • 软件工程技术专业软件开发综合实训室解决方案
  • 链动2+1:高效用户留存与增长的商业模式解析
  • Python 调用手机摄像头
  • E5053A 微波下变频器
  • 记录:uniapp直播的弹幕的样式修改与发送弹幕会自动滚动到底部两个技巧
  • 【流程设计】JAVA系统集成activiti工作流,流程设计器,在线审批,会签,驳回,流程图查看(实际多套系统运用案例分析)
  • Debezium系列之:大规模应用debezium server采集数据库,从每个Debezium Server中导出JMX采集指标
  • QY-SW 浮子水位计 RS485 LCD显示屏
  • 橘子学ES实战操作之管道类型Ingest pipelines的基本使用
  • VScode:前端开发中的常用快捷键和技巧
  • Radmin-同一局域网只需IP就可以控制电脑