当前位置: 首页 > news >正文

可缝合神经网络

文章目录

  • Stitchable Neural Networks
    • 摘要
    • 本文方法
    • 实验结果

Stitchable Neural Networks

摘要

包含大量强大的预训练模型族(如ResNet/DeiT)的model zoo已经达到了前所未有的范围,这对深度学习的成功有重要贡献。由于每个模型族都由具有不同尺度的预训练模型(例如,DeiT-Ti/S/B)组成,因此自然会出现一个基本问题,即如何有效地将这些现成的模型组装在一个家族中,以便在运行时动态地权衡精度和效率。

具体来说,SN-Net在块/层之间分割锚点,然后用简单的缝合层将它们缝合在一起,将一个锚点的激活映射到另一个锚点。只需几个epoch的训练,SN-Net就能有效地在不同尺度的锚点表现之间进行插值。在运行时,SN-Net可以通过切换拼接位置来即时适应动态资源约束。

大量的ImageNet分类实验表明,与许多单独训练的网络相比,SN-Net可以获得同等甚至更好的性能。同时支持不同的部署场景。例如,通过拼接Swin Transformers,我们用一个网络挑战Timm模型动物园中的数百个模型。我们相信这个新的弹性模型框架可以作为更广泛社区进一步研究的强大基线。
在这里插入图片描述
图1所示。与以前的可扩展深度学习框架相比。(a)网络压缩通过剪枝、量化、知识蒸馏等技术将大网络缩小为小网络,是一种一对一的映射。(b)单次神经架构搜索首先训练一个支持多种架构设置的超级网络,然后在部署过程中给定目标资源约束,对子网进行专门化,这是一对多的情况。©我们提出的可缝合神经网络直接缝合现成的预训练模型家族,并在一种新的多对多范式中快速获得有效的模型设计和部署的新网络

本文方法

在这里插入图片描述
图3。所提出的可缝合神经网络的示意图,其中三个预训练的DeiTs变体与简单的缝合层(1 × 1卷积)相连。我们在两个模型之间的相邻块之间共享相同的拼接层(例如,在本例中,两个块的步长为2)。除了基本锚点模型外,我们还通过缝合复杂度最近的锚点对获得了许多子网络(缝线),例如DeiT-Ti和DeiT-S(蓝线),DeiT-S和DeiT-B(绿线)。
在这里插入图片描述

实验结果

在这里插入图片描述

http://www.lryc.cn/news/109520.html

相关文章:

  • Android优化篇|网络预连接
  • pyspark使用XGboost训练模型实例
  • 完整模型的训练套路
  • PtahDAO:全球首个DAO治理资产信托计划的金融平台
  • 从零搭建一个react + electron项目
  • MATLAB /Simulink 快速开发STM32(使用st官方工具 STM32-MAT/TARGET),以及开发过程
  • LeetCode 热题 100 JavaScript--102. 二叉树的层序遍历
  • 常见Git命令
  • 在C语言中调用汇编语言的函数
  • Delphi Professional Crack,IDE插件开发和扩展IDE
  • 程序框架-公共MONO模块
  • 采用鲁棒随机森林实现的流异常检测:Python应用的一种新型机器学习方法
  • 缓存友好在实际编程中的重要性
  • uni-ajax网络请求库使用
  • MYSQL进阶-事务
  • python 常见数据类型和方法
  • a-date-picker报错TypeError: date4.locale is not a function
  • LNMP安装
  • matplotlib绘图风格
  • 【初级教程】Appium 启动应用 log 日志分析
  • FANUC机器人SRVO-300机械手断裂故障报警原因分析及处理办法
  • MobPush iOS SDK iOS实时活动
  • c++开发模式,组合模式
  • 【GITHUB】FlipIt – Windows的开源翻页时钟
  • 基于 Flink Paimon 实现 Streaming Warehouse 数据一致性管理
  • 云游戏App简记
  • ChatGPT已打破图灵测试,新的测试方法在路上
  • Flask学习笔记_异步CMS(五)
  • 争夺年度智能汽车「中间件」方案提供商TOP10,谁率先入围
  • 【Spring Cloud一】微服务基本知识