当前位置：首页 > news >正文

深度学习：计算卷积神经网络中输出特征图尺寸的关键公式

news 2025/9/4 12:38:44

计算卷积神经网络中输出特征图尺寸的关键公式

在设计卷积神经网络（CNN）时，准确计算每个卷积层的输出特征图尺寸是至关重要的。这不仅关系到网络的结构设计，也直接影响参数优化和整体性能。适当的计算可以确保网络层正确连接，避免资源浪费，并优化性能。以下内容提供了详细的参数说明和计算过程，包括如何从期望的输出特征图尺寸反向推导所需的padding量。

核心公式及参数详解

卷积层的输出特征图尺寸 (H_{out}) 和 (W_{out}) 通常通过以下公式计算：

对于输出高度 ( $H_{out}$ )：
[ $H_{out} = \left\lfloor \frac{H_{in} + 2 \times padding[0] - dilation[0] \times (kernel\_size[0] - 1) - 1}{stride[0]} + 1 \right\rfloor$ ]

对于输出宽度 ( $W_{out} $)：
[ $W_{out} = \left\lfloor \frac{W_{in} + 2 \times padding[1] - dilation[1] \times (kernel_size[1] - 1) - 1}{stride[1]} + 1 \right\rfloor $]

参数详解

( $H_{in}$ ), ( $W_{in}$ )：分别代表输入特征图的高度和宽度。
( $p a dd in g [0]$ ), ( $p a dd in g [1]$ )：分别在高度和宽度方向上的padding值，用于调整输入尺寸以适应特定的输出需求或操作边界条件。
( $d i l a t i o n [0]$ ), ( $d i l a t i o n [1]$ )：在高度和宽度方向上的扩张率。扩张卷积通过在卷积核元素之间插入“空格”，增加其感受野，使得卷积核能覆盖更大的区域，而不增加额外的参数。
( $kernel\_size[0]$ ), ( $kernel\_size[1]$ )：卷积核在高度和宽度方向上的尺寸，影响感受野的大小和参数数量。
( $s t r i d e [0]$ ), ( $s t r i d e [1]$ )：步长定义了卷积核在输入特征图上移动时的间距，直接影响输出特征图的尺寸。

反向推导Padding

已知输入尺寸、卷积核尺寸、步长、扩张率以及目标输出尺寸时，可以通过以下方式计算所需的padding：

对于高度方向的padding ( $p a dd in g [0]$ )：
[ $\left(\left(H_{out} - 1\right) \times stride[0] + dilation[0] \times (kernel\_size[0] - 1) + 1 - H_{in}\right) / 2$ ]

对于宽度方向的padding ( $p a dd in g [1]$ )：
[ $\left(\left(W_{out} - 1\right) \times stride[1] + dilation[1] \times (kernel\_size[1] - 1) + 1 - W_{in}\right) / 2$ ]

这些公式允许从期望的输出尺寸反向计算出必要的padding值，以确保输出尺寸符合设计规范。

示例

考虑一个输入特征图尺寸 ( $H_{in} = 32$ ), ( $W_{in} = 32$ )，使用 ( $\times 3$ ) 的卷积核，步长 ( $\times 1$ )，无扩张（ $d i l a t i o n 为 1$ ），并需输出特征图尺寸也为 ( $32 \times 32$ ) 的情况。