UNet改进(23):如何用SLCAM模块提升UNet的分割性能
1. UNet架构回顾
UNet最初是为生物医学图像分割设计的卷积神经网络,其结构对称,由编码器(下采样)和解码器(上采样)两部分组成,中间通过跳跃连接(skip connection)将低层特征与高层特征融合。
传统UNet的主要组成部分包括:
-
编码器部分:通过连续的下采样操作提取高层次特征
-
解码器部分:通过上采样操作逐步恢复空间分辨率
-
跳跃连接:将编码器的特征图与解码器的对应层特征图拼接,保留空间细节信息
2. 轻量化注意力模块(SLCAM)设计
2.1 注意力机制概述
注意力机制的核心思想是让网络能够"关注"输入数据中更重要的部分。在计算机视觉任务中,这通常表现为对特征图的空间位置或通道维度赋予不同的权重。
2.2 SLCAM模块结构
我们设计的轻量化注意力模块(SLCAM)同时结合了通道注意力和空间注意力,其结构如下:
class SLCAM(nn.Module):def __init__(self, channels, reduction_ratio=16):super(SLCAM, self).__init__()self.cha