当前位置: 首页 > news >正文

YOLOv9|加入2023Gold YOLO中的GD机制!遥遥领先!


专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,助力高效涨点!!!


一、Gold YOLO摘要

        在过去的几年里,YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改体系结构、增加数据和设计新的损失,将基线提高到了更高的水平。然而,我们发现以前的模型仍然存在信息融合问题,尽管特征金字塔网络(FPN)和路径聚合网络(PANet)已经缓解了这一问题。因此,本研究提供了一种先进的聚集和分布机制(GD)机制,该机制通过卷积和自注意操作来实现。这个新设计的模型名为Gold YOLO,它增强了多尺度特征融合能力,并在所有模型尺度上实现了延迟和准确性之间的理想平衡。


二、Gold YOLO模块详解

 2.1 模块简介

       Gold yolo的主要思想: 使用GD(gather-and-distribute)机制代替现有的通过不停间接迭代融合不同level的信息的机制​​​​​​​。

        GD由3种模块组成:FAM(Feature Alignment Module,特征对齐模块)、IFM(Information Fusion Module,信息融合模块)、Inject(Information Injection Module,信息注入模块)。其中FAM与IFM用于特征收集,Inject用于分发。

        low-GD主要用于融合模型浅层的特征信息,取代原Neck中的FPN结构,输入为B2,B3,B4,B5的特征张量。输入的特征张量首先通过Low-FAM进行空间尺度对齐并拼接在一起,之后送入IFM模块。分别经过Conv、RepVGGBlock、Conv进行特征提取融合,最后Split,送入Inject模块。

        high-GD主要用于融合模型深层的特征信息,取代原Neck中的FPN结构,输入为P3,P4,P5的特征张量。输入的特征张量首先通过High-FAM进行空间尺度对齐并拼接在一起,之后送入IFM模块。分别经过多头注意力机制和前向网络进行特征提取融合,最后Split,送入Inject模块。

        Inject模块输入有两个,一个是x_local,一个是x_global,也就是GD中处理完的特征张量。通过图中的Conv与空间的缩放操作与x_local进行特征融合,融合方式主要为点积和相加。


三、 GD模块使用教程

3.1 GD模块的代码


3.2 在YOLO v9中的添加教程


3.3 运行配置文件

这部分文章暂不开源!

⭐现在入手仅$ 59.9,早入早发论文!⭐

联系QQ: 2668825911 ,欢迎交流!

本项目持续更新,不付费订阅也可关注等每周更新,每周开源1-2篇。


http://www.lryc.cn/news/318787.html

相关文章:

  • WRF模型运行教程(ububtu系统)--III.运行WRF模型(官网案例)
  • html和winform webBrowser控件交互并播放视频(包含转码)
  • Neo4j 批量导入数据 从官方文档学习LOAD CSV 命令 小白可食用版
  • Day43-2-企业级实时复制intofy介绍及实践
  • 2024年AI辅助研发趋势深度解析:科技革新与效率提升的双重奏
  • bash: mysqldump: command not found
  • hcie数通和云计算选哪个好?
  • 浅易理解:非极大抑制NMS
  • C语言如何进⾏字符数组的复制?
  • Linux 中搭建 主从dns域名解析服务器
  • CSS3病毒病原体图形特效
  • Tomcat Web 开发项目构建教程
  • Elasticsearch(9) gauss的使用
  • php前端和java后端数据调用流程
  • C语言从入门到熟悉------第四阶段
  • 【目标检测-数据集准备】DIOR转为yolo训练所需格式
  • Nacos为什么对于临时实例采用心跳检测,非临时实例采用主动询问?Nacos同时作为配置中心和注册中心有什么坏处?为什么Nacos可以抗住那么高的注册?
  • 【NLP】如何实现快速加载gensim word2vec的预训练的词向量模型
  • 前端实例:页面布局1(后端数据实现)
  • 【调参】如何为神经网络选择最合适的学习率lr-LRFinder-for-Keras
  • 【设计模式】Java 设计模式之享元模式(Flyweight)
  • 异次元发卡源码系统/荔枝发卡V3.0二次元风格发卡网全开源源码
  • 腾讯春招后端一面(八股篇)
  • “风口”上的量化大厂“绣球”抛向中低频人才
  • obdiag如何实现一键采集20+故障场景的诊断信息——《OceanBase诊断系列》之九
  • Cookie和Session的获取方法
  • 旅游市场游客满意度调查报告
  • 为什么选用python开发web?
  • C# Chart曲线控件专题
  • Spring:StopWatch