当前位置: 首页 > news >正文

深度学习camp-第J7周:对于ResNeXt-50算法的思考

  • 🍨 本文为🔗365天深度学习训练营 中的学习记录博客
  • 🍖 原作者:K同学啊

📌你需要解决的疑问:这个代码是否有错?对错与否都请给出你的思考
📌打卡要求:请查找相关资料、逐步推理模型、详细写下你的思考过程

代码如下

# 定义残差单元  
def block(x, filters, strides=1, groups=32, conv_shortcut=True):  if conv_shortcut:  shortcut = Conv2D(filters * 2, kernel_size=(1, 1), strides=strides, padding='same', use_bias=False)(x)  # epsilon为BN公式中防止分母为零的值  shortcut = BatchNormalization(epsilon=1.001e-5)(shortcut)  else:  # identity_shortcut  shortcut = x  # 三层卷积层  x = Conv2D(filters=filters, kernel_size=(1, 1), strides=1, padding='same', use_bias=False)(x)  x = BatchNormalization(epsilon=1.001e-5)(x)  x = ReLU()(x)  # 计算每组的通道数  g_channels = int(filters / groups)  # 进行分组卷积  x = grouped_convolution_block(x, strides, groups, g_channels)  x = Conv2D(filters=filters * 2, kernel_size=(1, 1), strides=1, padding='same', use_bias=False)(x)  x = BatchNormalization(epsilon=1.001e-5)(x)  x = Add()([x, shortcut])  x = ReLU()(x)  return x

如果conv_shortcut=False,那么执行“x=Add()…”语句时,通道数不一致的,为什么不会报错呢?

思考

关键点分析:

  1. conv_shortcut=False 时的 shortcut

    • conv_shortcut=False 时,shortcut 直接等于 x,没有经过卷积层处理。也就是说,在 x = Add()([x, shortcut]) 这一行之前,shortcutx 是相同的张量。因此,它们的通道数和空间尺寸应该是相同的,直接相加是没有问题的。
    • 因此,执行 Add() 时,xshortcut 的维度是匹配的。
  2. conv_shortcut=True 时的 shortcut

    • conv_shortcut=True 时,shortcut 会通过一个 1x1 卷积进行通道数调整:
      shortcut = Conv2D(filters * 2, kernel_size=(1, 1), strides=strides, padding='same', use_bias=False)(x)
      
      • 这里 shortcut 的通道数被修改为 filters * 2,使其与主路径输出的通道数一致。
      • 如果步长 strides 是大于1的值(例如2),则 shortcut 的空间尺寸(高度和宽度)也会发生变化,因此需要保证它们的空间尺寸与主路径的输出相匹配。为此,使用 Conv2DBatchNormalization 来调整通道数,并保持 padding='same' 来避免空间尺寸的变化。
  3. Add() 层的作用

    • Add() 层要求输入张量的维度一致。如果 conv_shortcut=Falseshortcutx 在通道数和空间尺寸上已经是相同的,因此直接相加是不会出现维度不匹配的错误的。
    • 但是,如果通道数或空间尺寸不一致,Keras 会抛出错误,提示“维度不匹配”或类似错误。

为什么没有报错:

  • conv_shortcut=False 时,shortcutx 的维度是一样的,因为 shortcut = x,它们在通道数、空间尺寸等维度上都相同,因此 Add() 操作没有问题。
  • Add() 操作本身不会对维度进行任何变换,它只是简单地将两个张量逐元素相加。如果两个张量的维度不一致,Keras 会报错。

结论:

  • conv_shortcut=False 的情况下,shortcut 直接等于 x,因此它们的维度是相同的,Add() 操作能够成功执行。
  • 只有当 conv_shortcut=True 时,shortcut 会通过卷积进行维度调整,这样就确保了通道数和空间尺寸与主路径的输出一致,避免了维度不匹配的问题。

测试:

为了验证,可以在代码中添加调试语句,打印出 x.shapeshortcut.shape,看看它们在执行 Add() 之前是否匹配。例如:

print("x shape:", x.shape)
print("shortcut shape:", shortcut.shape)

这可以帮助进一步确认 xshortcut 在执行加法之前是否一致。

http://www.lryc.cn/news/520628.html

相关文章:

  • java: 错误: 无效的源发行版:17解决办法
  • Docker 安装开源的IT资产管理系统Snipe-IT
  • Go语言封装加解密包(AES/DES/RSA)
  • sql server 对 nvarchar 类型的列进行 SUM() 运算
  • java中json字符串键值获取
  • MPLS原理及配置
  • 口碑很好的国产LDO芯片,有哪些?
  • 【流程设计】类似钉钉的流程设计功能样式demo
  • ChatGPT入门之文本情绪识别:先了解LSTM如何处理文字序列
  • 测试开发之面试宝典
  • 399. 除法求值【 力扣(LeetCode) 】
  • 算法日记1:洛谷p2678跳石头(二分答案)
  • Unity shader中真的可以动态关闭Stencil Test吗?
  • YOLOv9改进,YOLOv9自研检测头融合HyCTAS的Self_Attention自注意力机制,2024,适合目标检测、分割任务
  • 计算机网络 (36)TCP可靠传输的实现
  • Git版本控制 - 创建使用Repository
  • MySQL —— 在CentOS9下安装MySQL
  • LeetCode 热题 100_腐烂的橘子(52_994_中等_C++)(图;广度优先遍历(队列))
  • Nginx 可观测性最佳实践
  • LabVIEW光流跟踪算法
  • Jira用例自动去除summary重复用例
  • 基于openEuler22.03SP4部署Prometheus+Grafana
  • 泛目录和泛站有什么差别
  • css 布局及动画应用(flex+transform+transition+animation)
  • springboot vue uniapp 仿小红书 1:1 还原 (含源码演示)
  • lombok在高版本idea中注解不生效的解决
  • 跨境电商领域云手机之选:亚矩阵云手机的卓越优势
  • Linux第二课:LinuxC高级 学习记录day02
  • 6. NLP自然语言处理(Natural Language Processing)
  • win10电脑 定时关机