当前位置: 首页 > news >正文

每天五分钟计算机视觉:搭建手写字体识别的卷积神经网络

本文重点

我们学习了卷积神经网络中的卷积层和池化层,这二者都是卷积神经网络中不可缺少的元素,本例中我们将搭建一个卷积神经网络完成手写字体识别。

卷积和池化的直观体现

手写字体识别

手写字体的图片大小是32*32*3的,它是一张 RGB 模式的图片,现在我们想识别它是从 0-9 这 10 个字中的哪一个,我们构建一个神经网络来实现这个功能。

第一个卷积层

过滤器大小为 5×5,步幅是 1,padding是 0,过滤器个数为 6,那么输出为 28×28×6。将这层标记为 CONV1,它用了 6 个过滤器,增加了偏差,应用了非线性函数 ReLU,最后输出 CONV1 的结果。

第一个池化层

然后构建一个池化层,使用最大池化的方式。参数 f= 2, s= 2,因为 padding 为 0,表示高度和宽度会减少一半。因此,28×28 变成了 14×14,通道数量保持不变,所以最终输出为 14×14×6,将该输出标记为 POOL1。

第二个卷积层

我们再为它构建一个卷积层,过滤器大小为 5×5,,即 f= 5,步幅是 1,padding 为 0,过滤器 16 个,所以 CONV2 输出为 10×10×16,这是CONV2 层。</

http://www.lryc.cn/news/218533.html

相关文章:

  • 【React】【react-globe.gl】3D Objects效果
  • 目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】SLAM(补充篇)
  • Pytorch 缓解过拟合和网络退化
  • 【算法】昂贵的聘礼(dijkstra算法)
  • hackergame2023菜菜WP
  • ubuntu20.04.6使用FTP-及相关安全配置
  • C++中不允许复制的类
  • 使用Python 脚自动化操作服务器配置
  • DL Homework 6
  • 软考高项论文-绩效域
  • 设计模式之装饰模式--优雅的增强
  • 前端vue,后端springboot。如何防止未登录的用户直接浏览器输入地址访问
  • linux安装Chrome跑web自动化
  • linux环境下编译,安卓平台使用的luajit库
  • indexedDB笔记
  • 系统提示缺少或找不到emp.dll文件的详细解决方案
  • Python实现自动化网页操作
  • 03 矩阵与线性变换
  • MySQL InnoDB数据存储结构
  • 【数据结构】数组和字符串(十五):字符串匹配2:KMP算法(Knuth-Morris-Pratt)
  • STM32 PWM可控制电压原理
  • angular、 react、vue框架对比
  • GNSS常用数据源汇总
  • 01|LangChain | 从入门到实战-介绍
  • 【小白专用】PHP基本语法 23.11.04
  • 路由器基础(七):NAT原理与配置
  • Spring Boot 整合SpringSecurity和JWT和Redis实现统一鉴权认证
  • 交换机基础(零):交换机基础配置
  • 02 线性组合、张成的空间与基
  • 解析mfc100u.dll文件丢失的修复方法,快速解决mfc100u.dll问题