当前位置: 首页 > news >正文

深度学习11-20

1.神经元的个数对结果的影响:
(http://cs.stanford.edu/people/karpathy/convnetjs/demo/classify2d.html)
在这里插入图片描述
(1)神经元3个的时候
在这里插入图片描述在这里插入图片描述
(2)神经元是10个的时候
在这里插入图片描述
神经元个数越多,可能会产生过拟合现象。

2.正则化和激活函数

(1)隐层1的神经元增加一个,相当于输入层输入一组参数
在这里插入图片描述
(2)正则化的作用
1)惩罚力度对结果的影响
惩罚力度=训练的loss+r(w)
惩罚力度小的时候,模型奇形怪状。
随着浪荡增大,测试集的效果更好
在这里插入图片描述

2)神经元,参数个数对结果的影响
64,128,256,512
(3)激活函数
sigmoid函数当梯度为0(斜率为0)的时候,不进行更新和传播,即梯度消失。
在这里插入图片描述
所以提出reLu函数,变量x<0,直接为0.

3.标准化

(1)数据预处理
把点中心化:把实际坐标值-均值。放缩:除以标准差
在这里插入图片描述
(2)参数初始化
(d,h)矩阵的行和列数
在这里插入图片描述
(3)Drop-out:在神经网络的训练过程中,在某一次的迭代中,每一层随机的按照固定的比例杀死一些神经元,不参与后序的更新与传播。杀死的神经元可能会在其他迭代中派上用场。Drop-out是个比例。防止神经网络训练过程太复杂。测试阶段没必要杀死。
过拟合是神经网络的一个大问题。
在这里插入图片描述
(4) 文字作填充、图像作标准化
在这里插入图片描述
根据loss值反向传播求出w1,w2,w3

过拟合解决方法:drop-out或者relu函数

5.卷积神经网络应用领域

(1)

在这里插入图片描述
(2)应用领域:检测任务、分类与检索、超分辨率重构、医学任务(ocr的字体识别)、无人驾驶、人脸识别
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

6.卷积网络与传统网络的区别

  1. NN(神经网络)-》CNN(卷积神经网络)
    在这里插入图片描述

  2. cnn处理三维数据(hwc)
    在这里插入图片描述

  3. 卷积层提取特征,池化层压缩特征,全连接层用一组权重参数连接起来

5.例子,x对应输入数据,w代表权重参数,蓝色矩阵下面的脚标就代表权重参数。最后的结果总和对应的是绿色矩阵里面的参数。 这个12也代表粉红色的那个331小矩阵的值为12.
在这里插入图片描述
也就是内积计算
在这里插入图片描述
6.图像颜色通道
(1)图像颜色通道 :R通道、G通道、B通道
在这里插入图片描述
在这里插入图片描述

(2)输入数据第三个维度c为3的话,过滤器filter的第三个维度也等于3.
如果过滤器(k,l,w)=(4,4,3),所以原始输入的数据(a,b,c)里面(a,b)选取也要(4,4)这样才能一一对应。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
将R+G+B的值相加 sum=0+2+0=2
最后加上偏置参数b
sum+b=2+1=3
所以输出的绿色第一个矩阵是3
(3)得到特征图表示
第三个维度指的是深度,深度也就是特征图的个数
7.步长与卷积核大小对结果的影响
在这里插入图片描述
(1)步长越大是粗粒度的,提取的特征越少。
在这里插入图片描述
在这里插入图片描述
e.g.6:6代表的是6个过滤器。
e.g.10: 10代表的是10个过滤器。
在这里插入图片描述

(2)图像任务一般是步长为1的(然后图像中h,w是一样的),提取的特征比较多,但是时间效率低。
(3)卷积核越小越细粒度的提取(一般最小的卷积核是3*3)
(4)边缘填充:越往边界的点,使用的次数越小;越往中间的点,使用的次数越多。
0只是做一下扩充,对最终结果没有影响。填充1圈0也可以,填充2圈0也可以,看你自己。

8.特征图尺寸计算与参数共享
(1)H2:代表结果;H1代表原始的输入;F代表过滤器的尺寸;2P:代表H长度是两边都要有0
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(2)权重参数,也就是每个区域选择相同的卷积核计算,也就是权重参数。
在这里插入图片描述

http://www.lryc.cn/news/387643.html

相关文章:

  • 耐磨材料元宇宙:探索未来科技的无限可能
  • 力扣2874.有序三元组中的最大值 II
  • Linux-笔记 嵌入式gdb远程调试
  • 观测云产品更新 | Pipelines、智能监控、日志数据访问等
  • docker 拉取不到镜像的问题:拉取超时
  • 防火墙双机热备
  • 30分钟学习如何搭建扩散模型的运行环境【pytorch版】【B站视频教程】【解决环境搭建问题】
  • 使用Java连接数据库并且执行数据库操作和创建用户登录图形化界面(1)
  • HarmonyOS Next开发学习手册——弹性布局 (Flex)
  • centOS7网络配置_NAT模式设置
  • 喜报 | 极限科技获得北京市“创新型”中小企业资格认证
  • 整合Spring Boot和Pulsar实现可扩展的消息处理
  • 如何给WPS、Word、PPT等办公三件套添加收费字体---方正仿宋GBK
  • 《重构》读书笔记【第1章 重构,第一个示例,第2章 重构原则】
  • 学会整理电脑,基于小白用户(无关硬件升级)
  • 使用ioDraw,AI绘图只需几秒钟!
  • Websocket解析及用法(封装一个通用订阅发布主题的webSocket类)
  • Foxit Reader(福昕阅读器)详细安装和使用教程
  • c++静态成员变量和静态成员函数
  • 视频共享融合赋能平台LntonCVS统一视频接入平台数字化升级医疗体系
  • Gin框架基础
  • 用GPT-4纠错GPT-4 OpenAI推出CriticGPT模型
  • SQL CASE WHEN语句的使用技巧
  • 虹科技术丨跨越距离障碍:PCAN系列网关在远程CAN网络通信的应用潜力
  • 【UE 网络】RPC远程过程调用 入门篇
  • 安装maven与nexus
  • 如何用DCA1000持续采集雷达数据
  • 怎么用JavaScript写爬虫
  • Leetcode 3203. Find Minimum Diameter After Merging Two Trees
  • 【抽代复习笔记】24-群(十八):循环群的两道例题