当前位置: 首页 > news >正文

Yolov5轻量化:CVPR2023|RIFormer:无需TokenMixer也能达成SOTA性能的极简ViT架构

 1.RIFormer介绍

 论文:https://arxiv.org/pdf/2304.05659.pdf

        本文基于重参数机制提出了RepIdentityFormer方案以研究无Token Mixer的架构体系。紧接着,作者改进了学习架构以打破无Token Mixer架构的局限性并总结了优化策略。搭配上所提优化策略后,本文构建了一种极致简单且具有优异性能的视觉骨干,此外它还具有高推理效率优势。 

 为什么这么做?

        Token Mixer是ViT骨干非常重要的组成成分,它用于对不同空域位置信息进行自适应聚合,但常规的自注意力往往存在高计算复杂度与高延迟问题。而直接移除Token Mixer又会导致不完备的结构先验,进而导致严重的性能下降。

        Token Mixer是ViT架构中用于空域信息聚合的关键模块,但由于采用了自注意力机制导致其计算量与内存消耗与图像尺寸强相关

         重参数方法在各个领域得到了广泛的应用。RIFormer推理时的TokenMixer模块可以视作LN+Identity组合

http://www.lryc.cn/news/93457.html

相关文章:

  • Spring-Retry实现及原理
  • Java中的锁
  • 学习系列:5种常见的单例模式变体及其实现方式
  • 三菱FX5U系列PLC之间进行简易PLC间链接功能的具体方法
  • 基于DBACAN的道路轨迹点聚类
  • 【项目】接入飞书平台
  • c++11 标准模板(STL)(std::ios_base)(三)
  • 在线协同办公小程序开发搭建开发环境
  • 【编译、链接、装载六】汇编——目标文件
  • 王道计算机考研408计算机组成原理汇总(下)
  • 偏向锁、轻量级锁、重量级锁、自旋锁、自适应自旋锁
  • Delta 一个新的 git diff 对比显示工具
  • C# 二进制序列化和反序列化示例
  • 【CSS】文字扫光 | 渐变光
  • Overhaul Distillation(ICCV 2019)原理与代码解析
  • <Linux开发>驱动开发 -之-内核定时器与中断
  • 希尔贝壳邀您参加2023深圳国际人工智能展览会
  • 设计优质微信小程序的实用指南!
  • 大数据期末总结
  • selenium面试题总结
  • ⑧电子产品拆解分析-1拖4USB拓展坞
  • 月度精华汇总 | 最新XR行业资讯、场景案例、活动都在这一篇里啦!
  • Redis实战案例1-短信登录
  • 华为OD机试真题 JavaScript 实现【找终点】【2023 B卷 100分】,附详细解题思路
  • 详解数据仓库数据湖及湖仓一体
  • 基于注解切换、Hikari实现的SpringBoot动态数据源(支持JNDI)
  • Java中的动态链接VS操作系统动态链接
  • 深入理解Linux虚拟内存管理(七)
  • GSR II 智能速度辅助系统的型式认证和系统作为独立技术单元的型式认证测试流程和技术要求
  • 工厂方法模式(五)