当前位置: 首页 > news >正文

深度学习:如何计算感受野

感受野(Receptive Field)是卷积神经网络(CNN)中的一个重要概念,用于描述输入图像中的一个像素在输出特征图中影响的区域大小。在设计和理解卷积神经网络时,计算感受野有助于理解网络如何对输入数据进行处理。

计算感受野的方法
单层卷积的感受野

对于一个卷积层,如果我们知道卷积核的大小 ( k ),步幅 ( s ),和填充 ( p ),单层卷积的感受野计算比较简单。对于第 ( i ) 层卷积,感受野可以表示为:
R i = k i + ( R i − 1 − 1 ) × s i Ri = ki + (R{i-1} - 1) \times si Ri=ki+(Ri11)×si
其中:

  • ( R i ) ( R_i ) (Ri) 是第 ( i ) 层的感受野大小
  • ( k i ) ( k_i ) (ki) 是第 ( i ) 层卷积核的大小
  • ( s i ) ( s_i ) (si) 是第 ( i ) 层的步幅
  • ( R i − 1 ) ( R_{i-1} ) (Ri1) 是前一层的感受野大小
多层卷积的感受野

为了计算整个网络的感受野,我们需要从最顶层(靠近输入)开始,逐层往上计算每一层的感受野。考虑网络中的每一层的卷积核大小、步幅和填充。

示例

假设一个简单的卷积神经网络如下:

输入图像大小为 (32 \times 32)

  • 第一层:卷积层,卷积核大小 ( 3 × 3 ) (3 \times 3) (3×3),步幅 1,填充 1
  • 第二层:池化层,池化窗口大小 ( 2 × 2 ) (2 \times 2) (2×2),步幅 2,填充 0
  • 第三层:卷积层,卷积核大小 ( 3 × 3 ) (3 \times 3) (3×3),步幅 1,填充 1

我们计算每一层的感受野:

  • 第0层(输入层),感受野大小 ( 1 × 1 ) (1 \times 1) (1×1)
  • 第1层(第一层卷积层):
    [ R 1 = 3 + ( 1 − 1 ) × 1 = 3 ] [ R_1 = 3 + (1 - 1) \times 1 = 3 ] [R1=3+(11)×1=3]
    感受野大小为 ( 3 × 3 ) (3 \times 3) (3×3)
  • 第2层(池化层):
    [ R 2 = 2 + ( 3 − 1 ) × 2 = 6 ] [ R_2 = 2 + (3 - 1) \times 2 = 6 ] [R2=2+(31)×2=6]
    感受野大小为 ( 6 × 6 ) (6 \times 6) (6×6)
  • 第3层(第二层卷积层):
    [ R 3 = 3 + ( 6 − 1 ) × 1 = 8 ] [ R_3 = 3 + (6 - 1) \times 1 = 8 ] [R3=3+(61)×1=8]
    感受野大小为 ( 8 × 8 ) (8 \times 8) (8×8)
因此,在这个简单的卷积神经网络中,最后一层输出的每一个像素对应输入图像中的一个 ( 8 × 8 ) (8 \times 8) (8×8) 区域。
实际计算例子

让我们通过一个更详细的实际例子来计算一个复杂卷积神经网络的感受野。假设以下是一个卷积神经网络结构:

输入图像大小: ( 224 × 224 ) (224 \times 224) (224×224)
  • 卷积层1:卷积核 ( 7 × 7 ) (7 \times 7) (7×7),步幅 2,填充 3
  • 最大池化层:池化窗口 ( 3 × 3 ) (3 \times 3) (3×3),步幅 2,填充 1
  • 卷积层2:卷积核 ( 3 × 3 ) (3 \times 3) (3×3),步幅 1,填充 1
我们从输入层开始逐层计算:
  • 输入层感受野:1
  • 卷积层1:
    [ R 1 = 7 + ( 1 − 1 ) × 2 = 7 ] [ R_1 = 7 + (1 - 1) \times 2 = 7 ] [R1=7+(11)×2=7]
    感受野大小: ( 7 × 7 ) (7 \times 7) (7×7)
  • 最大池化层:
    [ R 2 = 3 + ( 7 − 1 ) × 2 = 15 ] [ R_2 = 3 + (7 - 1) \times 2 = 15 ] [R2=3+(71)×2=15]
    感受野大小: ( 15 × 15 ) (15 \times 15) (15×15)
  • 卷积层2:
    [ R 3 = 3 + ( 15 − 1 ) × 1 = 17 ] [ R_3 = 3 + (15 - 1) \times 1 = 17 ] [R3=3+(151)×1=17]
    感受野大小: ( 17 × 17 ) (17 \times 17) (17×17)
这个计算过程可以通过一个Python脚本来自动化:
def calculate_receptive_field(layers):receptive_field = 1for layer in reversed(layers):kernel_size, stride, padding = layerreceptive_field = kernel_size + (receptive_field - 1) * stridereturn receptive_field# 定义网络的每一层:(卷积核大小,步幅,填充)
layers = [(3, 1, 1),  # Conv Layer 2(3, 2, 1),  # Max Pooling Layer(7, 2, 3)   # Conv Layer 1
]rf = calculate_receptive_field(layers)
print(f'The receptive field is {rf} x {rf}')

通过这个脚本,可以方便地计算任意复杂网络的感受野。

http://www.lryc.cn/news/409515.html

相关文章:

  • 【状语从句】
  • 阿里云服务器安装Anaconda后无法检测到
  • 在没有源程序的情况时,如何通过控制鼠标按钮控制电脑exe程序?
  • 如何排查GD32 MCU复位是由哪个复位源导致的?
  • 【C算法】编程初学者入门训练140道(1~20)
  • 消息队列-rabbitmq(生产者.消费者. 消息.可靠性)
  • 《InheriBT行为树》For Unity
  • 黑马头条Day11- 实时计算热点文章、KafkaStream
  • pnpm 设置国内源
  • 链表分割 C语言
  • python编程,设计一个详细的软件 与SADS 相似
  • META 备受期待的 Llama 3 405B 即将发布
  • c# Math.Round()四舍五入取整数
  • 【C++BFS算法】886. 可能的二分法
  • 【MySQL】记录MySQL加载数据(LOAD DATA)
  • 6 网络
  • SQL中CASE WHEN的用法
  • CTF-Web习题:[GXYCTF2019]Ping Ping Ping
  • python+vue3+onlyoffice在线文档系统实战20240725笔记,首页开发
  • 映美精彩色相机IFrameQueueBuffer转halcon的HObject
  • 写代码对人的影响
  • Hive-基础介绍
  • 网站如何从0-1搭建部署蓝图介绍
  • 面向对象(封装)练习题 巩固一下啦!
  • 一些问题 7/28
  • 昇思MindSpore 应用学习-基于MobileNetv2的垃圾分类
  • matlab 常用数据类型的转换
  • Cocos Creator2D游戏开发(6)-飞机大战(4)-敌机产生
  • Hugo部署到Vercel踩大坑——全是XML文件?
  • 2024 暑假友谊赛-热身1