当前位置: 首页 > news >正文

即插即用篇 | YOLOv8引入轴向注意力 Axial Attention | 多维变换器中的轴向注意力

本改进已集成到 YOLOv8-Magic 框架。

在这里插入图片描述

我们提出了Axial Transformers,这是一个基于自注意力的自回归模型,用于图像和其他组织为高维张量的数据。现有的自回归模型要么因高维数据的计算资源需求过大而受到限制,要么为了减少资源需求而在分布表达性或实现的便捷性上做出妥协。相比之下,我们的架构既保持了对数据联合分布的完全表达性,也易于使用标准的深度学习框架实现,同时在需要合理的内存和计算资源的同时,达到了标准生成建模基准测试的最先进结果。我们的模型基于axial attention,这是自注意力的一个简单泛化,自然地与张量的多个维度在编码和解码设置中对齐。值得注意的是,所提出的层结构允许在解码过程中并行计算大部分上下文,而不引入任何独立性假设。这种半并行结构极大地促进了甚至是非常大的Axial Transformer的解码应用。我们在ImageNet-32ImageNet-64 图像基准测试以及BAIR Robotic Pushing视频基准测试上展示了Axial Transformer 的最先进结果。我们开源了Axial Transformers 的实现。


1 论文简介

在当今深度学习的研究中,如何有效地处理高维数据,如图像和视频,是一个核心问题。Axial Transformers 提供了一种创新的自注意力机制&#x

http://www.lryc.cn/news/349140.html

相关文章:

  • 【芯片制造】【常用术语】CP、FT、WAT
  • 计算机vcruntime140.dll找不到如何修复,分享5种靠谱的修复教程
  • 超级简单的地图操作工具开发可疑应急,地图画点,画线,画区域,获取地图经纬度等
  • 25_NumPy数组np.round将ndarray舍入为偶数
  • Java字符串去除空格的方法
  • 【Python】【应用】Python应用之如何操作WiFi之一——使用pywifi
  • 2024OD机试卷-分割均衡字符串 (java\python\c++)
  • 完整版解答!2024年数维杯数学建模挑战赛B题
  • Android开发,日志级别
  • Docker 部署 MySQL 数据库
  • 代码技巧: 类中同一个函数可以同时存在常函数版本和普通函数版本(c++)
  • 2024OD机试卷-转盘寿司 (java\python\c++)
  • MongoDB创建或删除用户并验证数据库权限
  • 半小时搞懂STM32面经知识——RCC
  • 汇聚荣科技:拼多多开店没有流量应该怎么办?
  • uni-app(三):离线打包与插件引用(Android)
  • 数据分析——对比思维、A/B test
  • 深度探索Java工厂模式:创新与灵活性的结合
  • delphi6直连redis服务(用lua脚本redis模块)
  • 嵌入式Linux:编译和使用Protobuf库
  • 导航app为什么知道还有几秒变绿灯?
  • 设计模式 六大原则之单一职责原则
  • DOM重点核心(注册事件+DOM事件流)
  • 浅谈操作系统中的重要概念——线程(3)——设计模式
  • nginx配置域名与IP访问服务冲突问题
  • 2024OD机试卷-字符串序列判定 (java\python\c++)
  • 7-128 最长公共子串
  • 【瑞萨RA6M3】2. UART 实验
  • js遇到需要正则匹配来修改img标签+清除行内样式
  • Vue学习v-if与v-else-if