当前位置: 首页 > news >正文

EfficientNet

时间:2019

EfficicentNet网络简介

EfficientNet:Rethinking Model Scaling for Convolutional Neural Networksicon-default.png?t=N7T8https://arxiv.org/abs/1905.11946,这篇论文是Google在2019年发表的文章。

EfficientNet这篇论文,作者同时关于输入分辨率,网络深度,宽度对准确率的影响,在之前的文章中是单独增加图像分辨率或增加网络深度或单独增加网络的宽度,来试着提升网络的准确率。在EfficientNet这篇论文中,作者使用了网络搜索技术NAS去同时探索输入分辨率,网络深度、宽度的影响。

EfficientNet的效果究竟如何呢?

这幅图是原论文作者给出的关于Efficient以及当时主流的一系列分类网络的Top-1的准确率,我们发现EfficientNet不仅在参数数量上比很多主流模型要小以外,准确率明显也要更好

  • 论文中提到,本文提出的EfficientNet-B7在ImageNet top-1达到了当年最高的准确率84.3%,与之前准确率最高的GPipe相比,参数数量仅为其1/8.4,推理速度提升了6.1

网络对比(宽度、深度、分辨率)

  • 根据以往的经验,增加网络的深度depth能够得到更加丰富、复杂的特征并且能够很好的应用到其他任务中。但网络的深度过深会面临梯度消失,训练困难的问题。
  • 增加网络的width能够获得更细粒度的特征并且也更容易训练,但对于width很大而且深度较浅的网络往往很难学习到更深层次的特征。
  • 增加输入网络的图像分辨率能够潜在得获得更高细粒度的特征模板,但对于非常高的输入分辨率,准确度的增益也会减少。并且大分辨率图像会增加计算量。

从上图可以看出,scale by width,scale by depth,scale by resolution,发现这三条虚线基本上在准确率达到80%以后基本上就饱和了不在增加了。对于红色的线,我们同时增加网络的宽度、深度、分辨率,我们发现它达到了80%的准确率后并没有出现饱和的现象,并且还可以继续增长上去。这就说明了我们同时增加网络的深度、宽度、分辨率的话,我们是可以得到一个更好的结果的.

性能对比

  • EfficientNet-B0对比的是我们ResNet-50以及我们DenseNet-169,我们可以看到它的准确率是最高的,参数量是最少的,它的理论上的计算量是最低的。同样B1~B7都对一系列网络进行了对比
  • 不过在实际使用过程中,首先它的准确率确实是挺高的,然后它的参数个数确实也很少,这是毋庸置疑的。但是有个问题网络训练时非常占GPU的显存,因为在我们EfficientNet中像B4,B5,B6,B7这些模型,它的输入图片的分辨率非常大导致我们每一个层结构输出特征矩阵的高和宽都要相应的增加。所以对于我们显存的占用也会增加。
  • 而且对于速度直接对比Flops是不完全对的,真实情况下我们所关注的速度其实是在设备上的推理的速度;真实的推理速度和Flops其实不是直接相关的,它还有很多其他因素的影响,所以如果你能给出在某些设备上它的推理时间的话会更加有意义

http://www.lryc.cn/news/268675.html

相关文章:

  • 百度每天20%新增代码由AI生成,Comate SaaS服务8000家客户 采纳率超40%
  • 产品管理-学习笔记-版本的划分
  • 编程笔记 html5cssjs 004 我的第一个页面
  • 为实体服务器配置Ubuntu
  • 单例模式的双重检查锁定是什么?
  • hyper-v ubuntu 3节点 k8s集群搭建
  • postman进阶使用
  • errors包返回堆栈信息的性能测试
  • 力扣热题100道-哈希篇
  • YOLOv7+Pose姿态估计+tensort部署加速
  • gitee+picgo+typora图床搭建
  • Flink项目实战篇 基于Flink的城市交通监控平台(上)
  • thinkcmf 文件包含 x1.6.0-x2.2.3 已亲自复现
  • 本地部署 text-generation-webui
  • C语言实验1:C程序的运行环境和运行C程序的方法
  • 「微服务」微服务架构中的数据一致性
  • ARCGIS PRO SDK 要素空间关系
  • Python面向对象高级与Python的异常、模块以及包管理
  • Python 爬取 哔站视频弹幕 并实现词云图可视化
  • BP神经网络详细原理,BP神经网络训练界面详解,基于BP神经网络的公司财务风险分类
  • C++ DAY1 作业
  • 「微服务模式」七种微服务反模式
  • 运动耳机哪款性价比最高、性价比最高的运动耳机推荐
  • FreeRTOS软件定时器
  • 【Java集合类不安全示例】
  • cpp_07_类型转换构造_析构函数_深拷贝_静态成员
  • Java 已死、前端已凉?
  • Calico IP_AUTODETECTION_METHOD
  • 百分点科技成为中国“数据要素×”生态合作伙伴
  • 智能优化算法应用:基于孔雀算法3D无线传感器网络(WSN)覆盖优化 - 附代码