当前位置: 首页 > news >正文

Momentum Provably Improves Error Feedback!

以下是您提供的论文摘要的翻译:

**摘要**

由于在分布式环境中训练机器学习模型时通信开销较高,现代算法不可避免地依赖于有损通信压缩。然而,如果不加以处理,压缩造成的错误会传播,并可能导致严重的不稳定行为,包括指数发散。近十年前,Seide等人(2014年)提出了一种错误反馈(EF)机制,我们称之为EF14,作为缓解这一问题的极为有效的启发式方法。然而,尽管在过去十年中EF领域在算法和理论方面取得了稳步进展,但我们的理解仍然远未完整。在本工作中,我们解决了一个最紧迫的问题。特别是在经典的非凸设置中,所有已知的EF变体都依赖于非常大的批量大小才能收敛,这在实践中可能是不可行的。我们提出了一个令人惊讶的简单修复,理论上和实践中都消除了这个问题:将波利亚克(Polyak)的动量应用于Richtárik等人(2021年)提出的EF最新版本,称为EF21。我们命名为EF21-SGDM的算法在标准光滑性和有界方差假设下改善了先前错误反馈算法的通信和样本复杂度,并且不需要任何进一步的强假设,如有界梯度相似性。此外,我们提出了一种双动量版本的方法,进一步改善了复杂度。我们的证明似乎是新颖的,即使在去除压缩的情况下,该证明技术在非凸随机优化中结合波利亚克动量的研究中具有独立的兴趣。

http://www.lryc.cn/news/511164.html

相关文章:

  • Elasticsearch-脚本查询
  • 《Opencv》基础操作详解(3)
  • meshy的文本到3d的使用
  • C语言技巧之有条件的累加
  • 解释为什么fetch(JavaScript)无法将读取的数据存入外部变量
  • Windows Subsystem for Linux (WSL)
  • Go的Slice如何扩容
  • 使用云计算开发App 有哪些坑需要避免
  • ARM 架构--通用寄存器状态寄存器控制寄存器特殊用途寄存器
  • 最新SQL Server 2022保姆级安装教程【附安装包】
  • 学习C++:运算符
  • pdf有密码,如何实现pdf转换word?
  • AI发展新态势:从技术突破到安全隐忧
  • 王佩丰24节Excel学习笔记——第二十二讲:制作甘特图与动态甘特图
  • 若依框架之简历pdf文档预览功能
  • 酷瓜云课堂(内网版)v1.1.8 发布,局域网在线学习平台方案
  • python语音机器人(青云客免费api)
  • 使用ArcGIS/ArcGIS pro绘制六边形/三角形/菱形渔网图
  • 5.系统学习-PyTorch与多层感知机
  • AIGC与虚拟身份及元宇宙的未来:虚拟人物创作与智能交互
  • 基于大模型LLM 应用方案
  • 实用技巧:关于 AD修改原理图库如何同步更新到有原理图 的解决方法
  • 区块链平台安全属性解释
  • 1228作业
  • Machine-learning the skill of mutual fund managers
  • Windows下Python+PyCharm的安装步骤及PyCharm的使用
  • Anaconda+PyTorch(CPU版)安装
  • 第 28 章 - ES 源码篇 - Elasticsearch 启动与插件加载机制解析
  • 机床数据采集网关在某机械制造企业的应用
  • 美团Android开发200道面试题及参考答案(上)