当前位置：首页 > news >正文

YOLOv8改进：Neck篇——2024.1全新MFDS-DETR的HS-FPN特征融合层解析

news 2025/9/14 12:45:17

文章目录

- 一、HS-FPN的核心原理
- - 1.1 HS-FPN的设计背景
  - 1.2 HS-FPN的核心组件
- 二、HS-FPN在YOLOv8中的实现
- - 2.1 代码实现：HS-FPN通道注意力机制
  - 2.2 YOLOv8 Neck部分的HS-FPN集成
- 三、实验效果与性能对比
- - 3.1 参数量与计算量优化
  - 3.2 检测精度提升
- 四、总结与展望

目标检测领域近年来在速度和精度上取得了显著进步，而YOLOv8作为YOLO系列的最新版本，以其高效的实时检测性能广受关注。然而，传统的特征金字塔网络（FPN）在特征融合过程中仍存在参数量大、计算效率低等问题。本文将介绍一种基于MFDS-DETR的**HS-FPN（High-level Screening-Feature Fusion Pyramid Network）**结构，该结构通过创新的特征选择与融合机制，显著降低模型参数（减少100W参数），同时提升多尺度目标检测性能。

一、HS-FPN的核心原理

1.1 HS-FPN的设计背景

HS-FPN最初是为解决白细胞检测中的多尺度挑战而设计，但其轻量化与高效特征融合的特性使其适用于更广泛的目标检测任务。传统FPN仅通过简单的自上而下或自下而上路径进行特征融合，容易导致非相邻层间的语义信息丢失。HS-FPN通过**特征选择模块（Feature Selection Module, FSM）和特征融合模块（Feature Fusion Module, FFM）**优化这一过程。

1.2 HS-FPN的核心组件

特征选择模块（FSM）
- 采用通道注意力（CA）机制，结合全局平均池化（GAP）和全局最大池化（GMP）计算通道权重，筛选重要特征。
- 通过维度匹配（DM）机制调整不同尺度特征的维度，减少计算冗余。
特征融合模块（FFM）
- 采用**选择性特征融合（SFF）**策略，利用高级特征作为权重过滤低级特征，再通过双线性插值或转置卷积进行尺度对齐。
- 最终融合后的特征既保留高级语义信息，又增强低级细节特征。

二、HS-FPN在YOLOv8中的实现

2.1 代码实现：HS-FPN通道注意力机制

HS-FPN的核心是通道注意力模块，以下是PyTorch实现代码：

import torch
import torch.nn as nn
import torch.nn.functional as Fclass HSFPNChannelAttention(nn.Module):def __init__(self, in_planes, ratio=4, flag=True):super(HSFPNChannelAttention, self).__init__()# 自适应池化层self.avg_pool = nn.AdaptiveAvgPool2d(1)self.max_pool = nn.AdaptiveMaxPool2d(1)# 降维与升维卷积self.conv1 = nn.Conv2d(in_planes, in_planes // ratio, 1, bias=False)self.relu = nn.ReLU()self.conv2 = nn.Conv2d(in_planes // ratio, in_planes, 1, bias=False)self.flag = flag  # 是否与输入相乘self.sigmoid = nn.Sigmoid()# 初始化权重nn.init.xavier_uniform_(self.conv1.weight)nn.init.xavier_uniform_(self.conv2.weight)def forward(self, x):avg_out = self.conv2(self.relu(self.conv1(self.avg_pool(x))))max_out = self.conv2(self.relu(self.conv1(self.max_pool(x))))out = avg_out + max_out  # 特征融合return self.sigmoid(out) * x if self.flag else self.sigmoid(out)

2.2 YOLOv8 Neck部分的HS-FPN集成

在YOLOv8的Neck部分，替换标准FPN为HS-FPN，优化特征融合流程：

class HSFPN(nn.Module):def __init__(self, in_channels_list, out_channels):super(HSFPN, self).__init__()self.ca_layers = nn.ModuleList([HSFPNChannelAttention(ch) for ch in in_channels_list])self.conv_layers = nn.ModuleList([nn.Conv2d(ch, out_channels, 1) for ch in in_channels_list])self.upsample = nn.Upsample(scale_factor=2, mode='nearest')def forward(self, features):# features: [C3, C4, C5] 不同尺度的特征图selected_features = [ca(feat) for ca, feat in zip(self.ca_layers, features)]# 特征融合p5 = self.conv_layers[2](selected_features[2])p4 = self.conv_layers[1](selected_features[1]) + self.upsample(p5)p3 = self.conv_layers[0](selected_features[0]) + self.upsample(p4)return [p3, p4, p5]