当前位置: 首页 > news >正文

即插即用篇 | YOLOv8 引入 代理注意力 AgentAttention

在这里插入图片描述

Transformer模型中的注意力模块是其核心组成部分。虽然全局注意力机制具有很强的表达能力,但其高昂的计算成本限制了在各种场景中的应用。本文提出了一种新的注意力范式,称为“代理注意力”(Agent Attention),以在计算效率和表示能力之间取得平衡。代理注意力使用四元组(Q, A, K, V),引入了一组额外的代理token A。在此框架中,代理token首先充当查询token Q的代理,从K和V中聚合信息,然后将信息回传给Q。通过设计较少数量的代理token,代理注意力比常用的Softmax注意力效率更高,同时保留了全局上下文建模的能力。此外,本文展示了代理注意力等价于广义线性注意力的形式,因此它无缝结合了Softmax注意力的强大能力和线性注意力的高效特性。实验结果表明,代理注意力在各种视觉Transformer和视觉任务中表现出色,特别是在高分辨率场景中,代理注意力显示出其线性注意力特性,显著加速生成过程并提升图像质量。代码已公开在Github上。

  • 论文英文原名称: “Agent Attention: On the Integration of Softmax and Linear Attention”
http://www.lryc.cn/news/482878.html

相关文章:

  • 020_Servlet_Mysql学生选课系统(新版)_lwplus87
  • LabVIEW导入并显示CAD DXF文件图形 程序见附件
  • 《云原生安全攻防》-- K8s安全防护思路
  • 鸿蒙系统的发展及开发者机遇
  • Java | Leetcode Java题解之第556题下一个更大元素III
  • OSPF动态路由配置实验:实现高效网络自动化
  • CRM对企业有什么用?如何在实践中有效应用CRM系统?
  • 渗透测试之 -- Linux基础
  • 【excel】easy excel如何导出动态列
  • [Linux] 进程间通信
  • 【蓝桥等考C++真题】蓝桥杯等级考试C++组第13级L13真题原题(含答案)-最大的数
  • 【Linux】sudo make install 命令往系统中安装了什么 指定目录进行安装
  • RT-DETR融合CVPR[2020]轻量化卷积模块Ghost Module模块
  • 发布rust crate
  • Sequelize+Sqlite3使用示例
  • MyBatisPlus 用法详解
  • 强化学习入门笔记(Reinforcement Learning,RL) 强推!
  • C++ QT 工具日志异步分批保存
  • win32com库基于wps对Word文档的基础操作
  • Kubernetes 网络之深度探索:网络模型与 CNI 插件
  • Go 模块管理教程:go.mod 与依赖版本控制
  • 大数据 ETL + Flume 数据清洗 — 详细教程及实例(附常见问题及解决方案)
  • 鸿蒙next版开发:订阅应用事件(ArkTS)
  • F litter 开发之flutter_local_notifications
  • springboot参数校验
  • Spring生态学习路径与源码深度探讨
  • C++:set详解
  • (一)- DRM架构
  • Docker了解
  • 【DL】YOLO11 OBB目标检测 | 模型训练 | 推理