当前位置: 首页 > news >正文

卷积神经网络CNN之ZF Net网络模型详解(理论篇)

1.背景
2. ZF Net模型结构
3. 改进优缺点

一、背景

  ZF Net是用作者的名字命名的,Matthew D.Zeiler 和 Rob Fergus (纽约大学),2013年撰写的论文;

论文原网址https://arxiv.org/abs/1311.2901

论文名:Visualizing and Understanding Convolutional Networks

论文摘要:大型卷积神经网络在ImageNet上表现出优秀的性能。本文试图解决两个问题,这种模型为什么表现得如此优秀,以及如何改进模型。我们引入了一种新颖的可视化技术,深入了解中间特征层的功能和分类器的操作细节。可视化技术最终找到了一种比AlexNet性能更好的模型结构,还发现了模型的不同层次做出的性能贡献。

  这篇文章模型是2013ImageNet分类任务的冠军,其网络结构没什么改进,只是调了调参,性能较Alex提升了不少。
  ZF-Net只是将AlexNet第一层卷积核由11变成7,步长由4变为2,第3,4,5卷积层转变为384,384,256。这一年的ImageNet还是比较平静的一届,其冠军ZF-Net的名堂也没其他届的经典网络架构响亮。

二、ZF Net模型结构

补充:多通道卷积核卷积计算
下图是5* 5* 3被一个核的3* 3* 3=3* 3 *1
在这里插入图片描述

网络结构梳理
在这里插入图片描述
说明:论文中提出一种新的可视化技术,该技术可以了解中间特征图的功能和分类器的操作
  AlexNet第一层中有大量的高频(边缘)和低频(非边缘)信息的混合,却几乎没有覆盖到中间的频率信息。
  由于第一层卷积用的步长为4,太大,导致了有非常多的混叠情况,学到的特征不是特别好看,不像是后面的特征能看到一些纹理、颜色等。
  因此作者针对第一个问题将AlexNet的第一层的卷积核大小从11 *11改成7 *7。同时针对第二个问题将第一个卷积层的卷积核滑动步长从4改成2。同时,ZFNet将AlexNet的第3,4,5卷积层变为384,384,256。
  区别是AlexNet用了两块GPU训练把3、4、5层分了两块,而我们的结构更紧密。

网络层简介输入核数量-卷积窗口-填充-步长输出-激活函数核数量-池化窗口-步长输出-归一化过拟合方法
224 *224 *3使用96个核7* 7 *3的卷积,padding=0,stride=2110 *110 *96最大池化3 *3-stride=255 *55 *96-LRN局部响应归一化,尺度5x5
55 *55 *96使用256个核5* 5 *96的卷积,padding=0,stride=226 *26 *256最大池化3 *3-stride=213 *13 *256-LRN局部响应归一化,尺度5x5
13 *13 *256使用384个核3* 3*256的卷积,padding=1,stride=113 *13 *384无-归一化
13 *13 *384使用384个核3* 3*384的卷积,padding=1,stride=113 *13 *384无-归一化
13 *13 *384使用256个核3* 3*384的卷积,padding=1,stride=113 *13 *256最大池化3 *3-stride=26 *6 *256-归一化
全连接层一6*6 *256使用4096个6×6×256的卷积核进行卷积1x1x4096(—4096个神经元的运算结果通过ReLU激活函数中无-归一化Dropout:随机的断开全连接层某些神经元的连接,通过不激活某些神经元的方式防止过拟合。drop运算后输出4096个本层的输出结果值
全连接层二4096×1(4096个神经元)无-----4096个神经元的运算结果通过ReLU激活函数中无池化无-归一化4096个数据与第七层的4096个神经元进行全连接,然后经由relu7进行处理后生成4096个数据,再经过dropout7处理后输出4096个数据
输出层4096×1(4096个神经元)无-----4096个神经元的运算结果通过ReLU激活函数中无池化无-归一化

三、内容都有所提到,具体看ZF net 项目练习总结

http://www.lryc.cn/news/29171.html

相关文章:

  • Vue 3.0 响应性 基础 【Vue3 从零开始】
  • flex布局方式让最后一个(或第二个...n)元素居右显示
  • 【Python语言基础】——Python MySQL Order By
  • 自然数学的哲学原理--复数理论的扩展
  • tsconfig.json中的一些配置
  • Spark调优总结
  • 4.创建和加入通道相关(network.sh脚本createChannel函数分析)[fabric2.2]
  • 若依学习(前后端分离版)——自定义注解@Log(如何自定义注解,实现aop)
  • 防止暴力破解ssh的四种方法
  • jsp试卷分析管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目
  • 可选链运算符(?.)与空值合并运算符(??)
  • JavaScript 闭包
  • 每日记录自己的Android项目(二)—Viewbinding,WebView,Navigation
  • 20230305英语学习
  • 【Linux】手把手教你在CentOS上使用docker 安装MySQL8.0
  • 论文解读:High Dynamic Range and Super-Resolution from Raw Image Bursts
  • 国内的PMP考试通过率高达97%?
  • IOC(概念和原理)
  • 操作系统 - 第二章
  • 进程控制~
  • HCIP第一个实验
  • 阿里云轻量服务器--Docker--dubbo-admin安装(连接zookeeper nacos)
  • 树莓派Pico W无线WiFi开发板使用方法及MicroPython编程实践
  • Redis学习【11】之分布式系统
  • 光速c数列的猜想:光猜
  • 2023年全国最新交安安全员精选真题及答案12
  • 2023年全国最新安全员精选真题及答案14
  • 让Vue响应Map或Set的变化操作,在vue中响应map和set数据结构,计算属性的用法,计算属性特点
  • Unable to find a valid cuDNN algorithm to run convolution
  • Linux 进程:进程退出返回值的获取