Class27GoogLeNet
Class27GoogLeNet
GoogLeNet
GoogLeNet是 Google在2014年ILSVRC(ImageNet Large Scale Visual Recognition Challenge)比赛中提出的一种深度卷积神经网络,它在保持较低计算复杂度的同时取得了极好的性能。GoogLeNet 是深度学习网络结构设计的重要里程碑,标志着从“更深更宽”向“更有效率地堆叠模块”的方向转变。
GoogLeNet 的创新点
GoogLeNet 的核心是 Inception Module,它通过并行的不同尺寸卷积和池化操作提取特征,捕捉不同感受野的信息,最后将它们在通道维度上拼接。
Inception 模块中一般包括:
1×1 卷积(降维+非线性映射)
3×3 卷积(中等感受野)
5×5 卷积(大感受野)
3×3 max pooling 后再用 1×1 卷积(降低信息损失)
使用 1×1 卷积的好处
降低通道数(减少计算量)
增加网络深度、非线性表达能力
GoogLeNet 网络结构
模块位置 | 说明 |
---|---|
Input | 224×224×3 图像输入 |
Conv1 | 7×7 卷积,stride=2,输出 112×112×64 |
MaxPool1 | 3×3 池化,stride=2,输出 56×56×64 |
Conv2 | 1×1 + 3×3 卷积 |
MaxPool2 | 3×3 池化 |
Inception(3a,3b) | 两个 Inception 模块,输出 28×28×256 |
MaxPool | |
Inception(4a~4e) | 中间包含两个辅助分类器,在 4a 和 4d 后 |
MaxPool | |
Inception(5a,5b) | 输出 7×7×1024 |
Global Avg Pool | 7×7 平均池化为 1×1×1024 |
Dropout | rate=0.4 |
FC + Softmax | 输出 1000 类 |
GoogLeNet 的优点
高精度、 低参数量、 高效设计、多尺度信息提取。
后续改进版本
名称 | 改进点说明 |
---|---|
Inception v2 | BatchNorm、Factorized Conv、辅助正则 |
Inception v3 | 更深更宽、分解大卷积 |
Inception v4 | 和残差连接结合(Inception-ResNet) |