当前位置: 首页 > news >正文

LSKA(大可分离核注意力):重新思考CNN大核注意力设计

文章目录

  • 摘要
  • 1、简介
  • 2、相关工作
  • 3、方法
  • 4、实验
  • 5、消融研究
  • 6、与最先进方法的比较
  • 7、ViTs和CNNs的鲁棒性评估基准比较
  • 8、结论

摘要

https://arxiv.org/pdf/2309.01439.pdf
大型可分离核注意力(LSKA)模块的视觉注意力网络(VAN)已被证明在各种基于视觉的任务上提供了卓越的性能,超过了视觉转换器(ViTs)。然而,这些LSKA模块中的逐深度卷积层随着卷积核尺寸的增加,计算和内存占用呈二次增长。为了缓解这些问题,并使VAN的注意力模块能够使用极大的卷积核,我们提出了一种大型可分离核注意力模块,称为LSKA。LSKA将深度卷积层的2D卷积核分解为级联的水平1D和垂直1D内核。与标准LKA设计不同,提出的分解使得可以直接使用注意力模块中的深度卷积层的大内核,而不需要任何额外的块。我们证明,与标准LKA模块相比,VAN中的提议LSKA模块可以获得相当的性能,并降低计算复杂性和内存占用。我们还发现,随着内核尺寸的增加,提议的LSKA设计使VAN更加偏向于对象的形状而不是纹理。此外,我们对LKA和LSKA在VAN、ViTs和最近的

http://www.lryc.cn/news/204266.html

相关文章:

  • muduo源码学习base——Exception(带 stack trace 的异常基类)
  • 2023-10-24 小总结
  • 2-MySQL的基本操作记录
  • 网站页脚展示备案号并在新标签页中打开超链接
  • CentOS7 安装 nodejs
  • 工程化测试:Apollo的单元测试与集成测试指南
  • DevOps 笔记
  • 基于食肉植物优化的BP神经网络(分类应用) - 附代码
  • Docker部署SpringBoot +Vue项目流程详解(含域名 + HTTPS)
  • 需要在 MySQL 服务器中监控的重要指标
  • Hadoop之HDFS
  • 【Matlab笔记_17】查找数组中相同元素
  • 前端多媒体处理工具——ffmpeg的使用
  • Pandas 数据分析系列1--SeriesDataFrame数据结构详解
  • 【模型部署】c++部署yolov5使用openvino
  • DC-7 靶机
  • Mr.Alright---MTK安卓13 抬手亮屏功能的逻辑
  • thinkPHP5.0字符集修改为utf8mb4
  • [架构之路-242]:目标系统 - 纵向分层 - 应用程序的类型与演进过程(单机应用程序、网络应用程序、分布式应用程序、云端应用程序、云原生应用程序)
  • Jackson 反序列化失败,出现JSON: Unrecognized field
  • vscode代码快捷输入
  • 【微服务】Feign 整合 Sentinel,深入探索 Sentinel 的隔离和熔断降级规则,以及授权规则和自定义异常返回结果
  • Kurento多对多webrtc会议搭建测试
  • 蓝桥杯 (饮料换购,C++)
  • 《java核心卷Ⅰ》知识点总结(可作面试题)
  • 发成绩小程序,一键群发成绩给家长,省事
  • barzilar_borwein算法微调函数的优化收敛
  • SpringBoot篇---第一篇
  • 算法通关村第二关-白银挑战反转链表拓展问题
  • 【rust/树莓派】使用rppalembedded-graphics控制st7789 LCD屏幕