当前位置: 首页 > news >正文

人工智能练习题:激活函数需要满足的条件、提高CNN的泛化能力、CNN输出特征图大小计算

文章目录

    • 1.激活函数需要满足的条件
    • 2.提高CNN泛化能力的方法
    • 3.CNN输出特征图大小计算

第一次用ChatGPT,不得不说在处理大学生作业上,ChatGPT比国内的作业软件好用多了(感叹)

1.激活函数需要满足的条件

通常情况下,激活函数需要满足下面两个条件:

  • 非线性:激活函数需要是非线性函数,否则就相当于是一层线性变换,不能表达复杂的函数关系。
  • 可导性或近似可导性:梯度下降算法是常用的训练神经网络的方法,因此激活函数应当是可导的,或者至少是近似可导的。

根据上述条件,下列的函数不能作为激活函数:

  • f(x)=x:这是线性函数,不满足非线性的条件。
  • f(x)=|x|:这是非连续函数,不满足可导的条件。

2.提高CNN泛化能力的方法

训练CNN时,可以对输入进行旋转、平移、缩放等预处理提高模型泛化能力。这么说是对,还是不对?

对的。在训练卷积神经网络(CNN)时,可以对输入进行旋转、平移、缩放等预处理来提高模型的泛化能力。这种预处理技术称为数据增强(data augmentation),可以增加训练集的多样性,提高模型的鲁棒性和泛化能力,降低过拟合的风险。

通过旋转、平移、缩放等操作,可以生成与原始图像具有不同变换的新图像。这些新图像包含了更多的样本和多样性,可以帮助模型更好地学习特征,并且能够提高模型对于输入变化的适应能力。此外,数据增强可以有效地扩充训练集的大小,从而减少模型的过拟合。

因此,在实际应用中,数据增强已成为卷积神经网络训练的常用技术。

3.CNN输出特征图大小计算

输入图片大小为200×200,依次经过一层卷积(kernel size 5×5,padding 1,stride 2),pooling(kernel size 3×3,padding 0,stride 1),又一层卷积(kernel size 3×3,padding 1,stride 1)之后,输出特征图大小为(C)。

A.95
B.96
C.97
D.98

解答

输入图片大小为200×200,经过第一层卷积后,特征图大小为:

Kernel size: 5x5
Padding: 1
Stride: 2
输出特征图大小为:

Height: (200 + 2 * 1 - 5) / 2 + 1 = 99
Width: (200 + 2 * 1 - 5) / 2 + 1 = 99
经过池化层后,特征图大小为:

Kernel size: 3x3
Padding: 0
Stride: 1
输出特征图大小为:

Height: (99 - 3) / 1 + 1 = 97
Width: (99 - 3) / 1 + 1 = 97
经过第二层卷积后,特征图大小为:

Kernel size: 3x3
Padding: 1
Stride: 1
输出特征图大小为:

Height: (97 + 2 * 1 - 3) / 1 + 1 = 97
Width: (97 + 2 * 1 - 3) / 1 + 1 = 97
因此,最终输出的特征图大小为 97x97。

http://www.lryc.cn/news/18486.html

相关文章:

  • KingbaseES Json 系列三:Json数据操作函数一
  • 《设计模式》单例模式
  • C/C++每日一练(20230224)
  • 基于YOLO的酸枣病虫害检测识别实践
  • WAF:ModSecurity on Nginx(15)
  • Qt 第3课、Qt 中的字符串类
  • Vulnhub靶场----6、DC-6
  • 华为OD机试真题Python实现【去重求和】真题+解题思路+代码(20222023)
  • lammps教程:Ovito选择特定晶粒的方法
  • DevEco Studio 3.1 Beta1版本发布——新增六大关键特性,开发更高效
  • 【蓝桥杯每日一题】二分算法
  • Spring Batch 高级篇-并行步骤
  • 对spring的@Cacheable缓存理解
  • 力扣-市场分析
  • 【2357. 使数组中所有元素都等于零】
  • 什么品牌的游戏蓝牙耳机比较好?玩游戏延迟低的蓝牙耳机推荐
  • day 33 状态压缩dp
  • 扬帆优配|超3600股飘绿,人民币贬值近300点!外资净卖近38亿
  • 【编程基础之Python】6、Python基础知识
  • selenium基本操作
  • 思科设备命令讲解(超基础二)
  • HTML基础(3)
  • 鸿蒙3.0 APP混合开发闪退问题笔记
  • 批量操作文件功能-课后程序(JAVA基础案例教程-黑马程序员编著-第七章-课后作业)
  • Hadoop3.3.1完全分布式部署
  • SpringMVC中的注解
  • python+Vue学生作业系统 django课程在线学习网站系统
  • CSS 美化网页元素【快速掌握知识点】
  • Tableau连接openGauss实践
  • RabbitMQ 实现延迟队列