当前位置: 首页 > news >正文

5分钟理解什么是卷积的特征提取

大家好啊,我是董董灿。

卷积算法之所以重要,关键在于其提取特征的能力。

5分钟入门卷积算法中提到,卷积模仿的就是人眼识图的过程,以“感受野”的视角去扫描图片,从而获取不同区域的图片信息。

在这一过程中,通过设计多个不同尺寸的卷积核,对一张图片进行卷积操作,以完成在不同尺度下特征的提取。

那么什么是卷积的特征提取呢?卷积都提取出了哪些特征呢?

1、卷积的数学描述

我们通常说特征图或者数据集的尺寸是 [n, h, w, c],其中,n 代表的是图片的张数,h 代表的是图片的高度,w 代表的是图片的宽度,c 代表图片的通道数。

例如如果一张图片是RGB的格式,那么 c 就等于3。

图片

对于卷积算法而言,输入图片尺寸为 [n, hi, wi, c](标i代表input,输入),卷积核尺寸为 [kn, kh, kw, c],输出图片尺寸为[n, ho, wo, kn](下标o代表output)。

有没有发现,输出图片的channel数与输入图片的channel数不一致,输出图片的channel数与卷积核的个数是一致的。

channel也即通道,在特征图中,一个channel代表一个特征,channel的个数代表特征的个数。

因此,经过卷积计算,特征图中特征的个数,与卷积核的个数是一致的。

2、图片的特征

输出特征图的通道数与卷积核的个数相同一样,这意味着什么呢?

意味着如果我设计一个卷积,存在100个卷积核,那么经过卷积就可以输出具有100个特征的特征图。

卷积算法,可以通过设计卷积核的个数,随意的提取图片不同的数量的特征,卷积算法,就是通过线性变换,将图片映射到特征空间。

那么,特征怎么理解呢?

图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。

图片

RGB图像和它的3个颜色特征通道

RGB图片有3个通道,可以说有3个颜色特征,分别为红色,绿色和蓝色;那么纹理特征,形状特征和空间特征又是什么意思呢?

纹理特征就是图片的纹理,比如下面这样。

图片

形状特征就是图片中物体的形状,比如下面这样。

图片

那么卷积这一算法在神经网络的训练过程中学习到这些特征了么?

答案是肯定的!

卷积不仅学到了这些特征,而且还学到了很多人们不太好描述的特征,这些特征对于人类来说可能毫无意义,但对于神经网络来说,确实十分重要的。

更多卷积学到了什么特征,可以移步:卷积特征是怎么被可视化的?

在著名的论文《Visualizing and Understanding Convolutional Networks》中有关于卷积算法特征的表述,在文中,随着神经网络深度的加深,卷积提取到的特征逐渐清晰起来。

由浅层次的纹理特征,逐步到深层次的形状特征,比如,在Layer 4中提取的特征图中便可以看到狗狗的形象。

不同的卷积神经网络中卷积的层数是不同的,而且卷积的参数也不同。

举个例子,在图像分类任务中,卷积神经网络在训练学习的时候,每一层学习到的特征是不同的,比如第一层的输入只有3个颜色特征,输出有64个特征,至于这64个特征代表的是什么,可能连神经网络自己也说不清,一直到最后一层可能会有几千个特征。

到了最后一层,可以这么比喻:几千个特征,实际上已经代表了几千种物体的分类了。针对一张图片是猫的原始输入,几千个特征中,只有猫这一特征最后的得分最高,因此,网络会把它推理成猫。

这就是卷积算法的核心,特征提取。

http://www.lryc.cn/news/185690.html

相关文章:

  • Legion Y9000X IRH8 2023款(82Y3)原装出厂OEM预装Windows11系统
  • 【Acwing1010】拦截导弹(LIS+贪心)题解
  • DevicData-D-XXXXXXXX勒索病毒数据恢复|金蝶、用友、管家婆、OA、速达、ERP等软件数据库恢复
  • 从入门到精通,30天带你学会C++【第七天:for循环和while循环以及数组的学习】(学不会你找我)
  • Python 编程基础 | 第五章-类与对象 | 5.2、数据成员
  • PHP 个人愿望众筹网站系统mysql数据库web结构apache计算机软件工程网页wamp
  • JS--判断空值(null、undefined、NaN、false、空字符串等)
  • ChatGPT 背后包含了哪些技术?
  • Vue Router(二)
  • ELK整合springboot(第二课)
  • 运维常见的22个故障排查和10个问题解决技巧大汇总!
  • 解决 TensorFlow 2.x 中的 “AttributeError: module ‘tensorflow‘ has no attribute ‘placeholder‘“ 错误
  • 新风机注意事项有哪些?
  • GitHub基础
  • 读书笔记--未来简史关键金句和阅读感悟
  • 【Vue2.0源码学习】生命周期篇-销毁阶段(destroy)
  • 代理IP与Socks5代理在多领域的卓越应用
  • kafka怎么实现零拷贝(Zero-Copy)的?
  • Hive【Hive(四)函数-单行函数】
  • C语言学生成绩录入系统
  • 操作系统对内存的管理:分配与回收,虚拟内存,内存容量的扩充,内存保护,补充(链接方式、装入方式)
  • [开源]基于Vue的拖拽式数据报表设计器,为简化开发提高效率而生
  • 微信小程序——CSS3渐变
  • CCF中国开源大会专访|毛晓光:“联合”是开源走向“共赢”的必由之路
  • 多校联测11 8ady
  • 【软考】9.1 顺序表/链表/栈和队列
  • 来 来 来 国家开放大学模拟题型 训练
  • 【ONE·Linux || 多线程(二)】
  • pandas.DataFrame.to_excel:在同一个sheet内追加数据
  • 基于卷积神经网络的图像识别技术研究与实践