当前位置: 首页 > news >正文

每天五分钟计算机视觉:基于卷积操作完成滑动窗口的图片分类?

本文重点

我们前面学习了使用不同大小的滑动窗口来滑动图片,然后切分成许多小的图片,然后依次应用到我们已经训练好的图像分类模型中,但是这种方式效率太低了,本节课程我们学习一种新的方式,来看一下如何并行识别这些剪切的图片。

原始结构

首先我们先来看一下,如何把神经网络的全连接层转化成卷积层,现在有一个已经训练好的卷积神经网络,前面是卷积层,后面是全连接层。

当输入到该模型一个14*14*3的图片,它的维度是如何变化的?

首先它经过16个5*5*3的过滤器,此时输出变为10*10*16的图片,然后通过参数为2*2的最大池化操作,图像减少到5*5*16,之后连接一个400个单元的全连接神经网络,然后又是一个400单元的全连接神经网络,最后softmax输出y,用 4 个数字来表示,它们分别对应4 个分类出现的概率,这 4 个分类可以是行人、汽车、摩托车和背景或其它对象。

结构变换

现在我们能够使用卷积层来完成全连接神经网络一样的效果吗?也就是说如何把如上所示的卷积神经网络中的全连接层转化为卷积层?

首先这个新的卷积神经网络的卷积层和以前的结构是一样的。而对于第一个全连接层,我们可以用400个 5×5*16 的过滤器来实现, 输出维度就是 1×1×400,我们不再把它看作一个含有 400 个节点的集合,而是一个 1×1×400的输出层。从数学角度看,它和全连接层是

http://www.lryc.cn/news/341112.html

相关文章:

  • UI设计/交互设计/视觉设计项目汇报/作品集Figma/PPT模板
  • 25、Lua 学习笔记之三(高阶话题)
  • 企业网盘搭建——LNMP
  • Go语言异常处理方式
  • 时序分析基本知识点
  • ELK(Elasticsearch+Logstash+Kibana)日志分析系统
  • 【投稿优惠-EI稳定检索】2024年地理信息技术与遥感测绘国际学术会议(ICGITRSM 2024)
  • MySQL的内外连接
  • Pandas连接MySQL数据库
  • 2024华中杯数学建模参考思路+完整代码+后续成品论文预约
  • ARM_day8:基于iic总线的通信
  • 33、Lua Cocos2d-x使用Luajit实现加密
  • spring 集成 mybatis
  • rtpengine 的端点学习模式
  • Windows 安装 A UDP/TCP Assistant 网络调试助手
  • web自动化系列-selenium的3种等待方式(十一)
  • 每日OJ题_完全背包④_力扣279. 完全平方数(一维和二维)
  • web项目中jsp页面不识别el表达式
  • 【Python基础】字典
  • 2024HW --> 安全产品 Powershell无文件落地攻击
  • 力扣哈哈哈哈
  • RUM 最佳实践-视觉稳定性的探索与实践
  • PostgreSQL的学习心得和知识总结(一百三十八)|深入理解PostgreSQL数据库之Protocol message构造和解析逻辑
  • 爬虫开发教程
  • 【Python】高级进阶(专版提升3)
  • LeetCode 1378、1277、2944
  • 【缓存常见问题】
  • Python爬取猫眼电影票房 + 数据可视化
  • Spring Boot深度解析:是什么、为何使用及其优势所在
  • 面向对象——类与对象