当前位置: 首页 > news >正文

用C语言构建一个数字识别卷积神经网络

8d858f7f97e348979ddd766b6fc45a7f.jpeg

 卷积神经网络的具体原理和对应的python例子参见末尾的参考资料2.3.

这里仅叙述卷积神经网络的配置, 其余部分不做赘述,构建和训练神经网络的具体步骤请参见上一篇: 用C语言构建一个手写数字识别神经网路

卷积网络同样采用简单的三层结构,包括输入层conv_layer,中间层maxpool_layer, 和输出层output_layer, 其中输出层为全连接层.

 Input(28*28) |>>> CONV3X3 (26x26x8_out)  >>>|<<< MAXPOOL2X2 (13x13x8_out) >>>|<<< NVCELLs (10_out) >>>|

输入层conv_layer:  

为3x3的卷积层, 默认8个卷积核, 采用valid_padding(不填充),移动扫描步长为1,不考虑偏置项. 需要通过训练来确定各个卷积核参数. 3x3的卷积核相比5x5和7x7的卷积核其参数量更少,非线性度更高,同时可以提取更小的特征. (5x5和7x7的卷积可以用多层3x3卷积来表示, 当然,随着层数的增加可能会产生新的问题.) 卷积层的输入部分就是灰度值表示的28x28的手写数字图像,这里也预先进行了归一化处理,即除以255.0.
每个核对28x28数据进行卷积运算后输出26x26个数值. 每个卷积核只需要学习9个参数, 8个卷积核一共是72个参数. 如果是用20个全连接的神经元作为输入层的话,一共需要学习(28x28+1)x20=15700个参数.

中间层maxpool_layer:  

采用2x2最大池化,步长也为2, 池化层没有参数, 不需要学习.MAXPOOL具有防止过拟合的作用,因其仅对最大值对应的节点进行反向传导,相当于断开了与其他节点的连接.在这里maxpool直接将conv_layer每个核的输出26x26下采样到13x13.

输出层output_layer:

 一共10个神经元,分别对应0~9数字的可能性,与中间层的输出进行全连接,这里中间层的输出数据已展平成一维.假定中间层的输出是13x13x8, 那么展平后就是1352个节点.也就是说输出层的每一个神经元都需要与这1352个节点连接,每一个神经元需要学习1352(w)+1(b)个参数.

取5万条训练样本进行训练,训练后再进行测试,其准确率可超过94%.
与全连接的神经网络相比较,卷积神经网络的参数量大大降低,训练的所需要时间也相应减少.

源代码:

https://github.com/midaszhou/nnc
下载后编译:
make TEST_NAME=test_nnc3

9b6222d11de54bc7881ea3e68b1adf55.png

参考资料:
1.  MNIST手写数字集 http://yann.lecun.com/exdb/mnist/

2.  CNNs, Part 1: An Introduction to Convolutional Neural Networks - victorzhou.com 

3.  CNNs, Part 2: Training a Convolutional Neural Network - victorzhou.com

 

 

 

 

http://www.lryc.cn/news/110844.html

相关文章:

  • 【CSS】圆形放大的hover效果
  • work weekly
  • Mac端口扫描工具
  • 如何隐藏开源流媒体EasyPlayer.js视频H.265播放器的实时录像按钮?
  • Spring Cloud Eureka 和 zookeeper 的区别
  • Golang之路---04 并发编程——信道/通道
  • 【Rust 基础篇】Rust派生宏:自动实现trait的魔法
  • PHP8的程序结构-PHP8知识详解
  • Spring Cloud +UniApp 智慧工地云平台源码,智能监控和AI分析系统,危大工程管理、视频监控管理、项目人员管理、绿色施工管理
  • “科创中国”青百会轮值主席吴甜:以大语言模型为代表的AI将引发产业变革
  • 【Git /Github】知识学习
  • 【雕爷学编程】Arduino动手做(181)---Maixduino AI开发板2
  • PHP 编译问题PEAR package PHP_Archive not installed的解决
  • 【探索Linux】—— 步步学习强大的命令行工具 P.1(Linux简介)
  • STM32 CubeMX USB_OCO(USB_转串口)
  • 使用JProfiler进入JVM分析
  • 高级web前端开发工程师的职责说明(合集)
  • powerdesigner各种字体设置;preview字体设置;sql字体设置
  • MyBatis查询数据库(4)
  • Python3 处理PDF之PyMuPDF 入门
  • 使用隧道HTTP时如何解决网站验证码的问题?
  • Java超级玛丽小游戏制作过程讲解 第三天 创建并完成常量类02
  • ARM微架构
  • Stable Diffusion AI绘画学习指南【本地环境搭建win+mac】
  • Unity 3D ScrollRect和ScrollView回弹问题的解决
  • python编写小程序有界面,python编写小程序的运行
  • 【中断机制】什么是中断?使用中断的原因、注意事项
  • C++20 协程(coroutine)入门
  • 2023.8.6
  • kubernetes网络之网络策略-----Network Policies - Default