当前位置：首页 > news >正文

卷积操作尺寸计算公式

news 2025/7/23 10:22:14

卷积操作尺寸计算公式

卷积操作尺寸计算公式
- 通用公式
- 通用公式（含Dilation）
- - 关键说明

卷积操作尺寸计算公式

在深度学习和图像处理中，卷积操作会改变输入图像的尺寸。计算卷积后图像尺寸的通用公式取决于以下几个参数：

输入图像尺寸：通常表示为高度 $HinH_{\text{in}}$ 和宽度 $WinW_{\text{in}}$ （单位：像素）。
卷积核大小：通常表示为高度 $K_h$ 和宽度 $K_w$ （单位：像素）。如果卷积核是正方形的（常见情况），则 $K_h = K_w = K$ 。
步幅（stride）：卷积核在图像上移动的步长，通常表示为高度方向步幅 $S_h$ 和宽度方向步幅 $S_w$ 。如果步幅相同，则 $S_h = S_w = S$ 。
填充（padding）：在图像边缘添加的像素数，通常表示为高度方向填充 $P_h$ 和宽度方向填充 $P_w$ 。如果填充对称，则 $P_h = P_w = P$ 。填充可以是零填充（常见）或其他方式。

通用公式

卷积后输出图像的高度 $HoutH_{\text{out}}$ 和宽度 $WoutW_{\text{out}}$ 的计算公式如下：

$Hout=⌊Hin+2Ph−KhSh⌋+1H_{\text{out}} = \left\lfloor \frac{H_{\text{in}} + 2P_h - K_h}{S_h} \right\rfloor + 1$

$Wout=⌊Win+2Pw−KwSw⌋+1W_{\text{out}} = \left\lfloor \frac{W_{\text{in}} + 2P_w - K_w}{S_w} \right\rfloor + 1$

其中：

$⌊⋅⌋\left\lfloor \cdot \right\rfloor$ 表示向下取整（floor 函数），确保结果为整数。
公式假设卷积操作是标准的（无膨胀或其他修改）。

通用公式（含Dilation）

当卷积操作包含膨胀率（dilation rate）时，卷积核的感受野会扩大，导致输出尺寸进一步变化。

设：

输入图像尺寸：高度 $HinH_{\text{in}}$ ，宽度 $WinW_{\text{in}}$
卷积核尺寸：高度 $K_h$ ，宽度 $K_w$
膨胀率：高度方向 $D_h$ ，宽度方向 $D_w$ （通常 $D_h = D_w = D$ ）
步幅：高度方向 $S_h$ ，宽度方向 $S_w$
填充：高度方向 $P_h$ ，宽度方向 $P_w$

输出尺寸计算公式为：
$Hout=⌊Hin+2Ph−[(Kh−1)×Dh+1]Sh⌋+1Wout=⌊Win+2Pw−[(Kw−1)×Dw+1]Sw⌋+1\boxed{ \begin{aligned} H_{\text{out}} &= \left\lfloor \frac{H_{\text{in}} + 2P_h - [\ (K_h - 1) \times D_h + 1\ ]}{S_h} \right\rfloor + 1 \\ W_{\text{out}} &= \left\lfloor \frac{W_{\text{in}} + 2P_w - [\ (K_w - 1) \times D_w + 1\ ]}{S_w} \right\rfloor + 1 \end{aligned} }$

关键说明

膨胀后的卷积核有效尺寸：
- 膨胀操作通过在卷积核元素间插入 $D - 1$ 个空格来扩大感受野。
- 膨胀后的有效高度： $Kh′=(Kh−1)×Dh+1K_h' = (K_h - 1) \times D_h + 1$
- 膨胀后的有效宽度： $Kw′=(Kw−1)×Dw+1K_w' = (K_w - 1) \times D_w + 1$
- 公式中的 $[(Kh−1)×Dh+1][\ (K_h - 1) \times D_h + 1\ ]$ 和 $[(Kw−1)×Dw+1][\ (K_w - 1) \times D_w + 1\ ]$ 即膨胀后的有效核尺寸。
公式逻辑：
- 分子部分：
  $Hin+2Ph−Kh′H_{\text{in}} + 2P_h - K_h'$ （宽度同理）
  表示输入尺寸加填充后，减去膨胀后的有效核尺寸。
- 分母部分：除以步幅 $S_h$ （或 $S_w$ ）。
- 取整操作 $⌊⋅⌋\left\lfloor \cdot \right\rfloor$ ：确保输出为整数像素位置。
- +1：包含卷积核起始位置对应的输出。
当膨胀率 $D = 1$ 时：
公式退化为标准卷积（无膨胀），因为：
$Kh′=(Kh−1)×1+1=KhK_h' = (K_h - 1) \times 1 + 1 = K_h$ 。