当前位置: 首页 > news >正文

改进YOLO系列 | CVPR2023最新Backbone | FasterNet 远超 ShuffleNet、MobileNet、MobileViT 等模型

在这里插入图片描述

论文地址:https://export.arxiv.org/pdf/2303.03667v1.pdf


为了设计快速神经网络,许多工作都集中在减少浮点运算(FLOPs)的数量上。然而,作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少。这主要源于每秒低浮点运算(FLOPS)效率低下。并且,如此低的FLOPS主要是由于运算符的频繁内存访问,尤其是深度卷积。因此,本文提出了一种新的partial convolution(PConv),通过同时减少冗余计算和内存访问可以更有效地提取空间特征。基于PConv进一步提出FasterNet,在广泛的设备上实现了比其他网络高得多的运行速度,而不影响各种视觉任务的准确性。同时,实现了令人印象深刻的83.5%的TOP-1精度,与Swin-B不相上下,同时GPU上的推理吞吐量提高了49%,CPU上的计算时间也节省了42%。


简介

神经网络在图像分类、检测和分割等各种计算机视觉任务中经历了快速发展。尽管其令人印象深刻的性能为许多应用程序提供了动力,但一个巨大的趋势是追求具有低延迟和高吞吐量的快速神经网络,以获得良好的用户体验、即时响应和安全原因等。

如何快速?研究人员和从业者不需要更昂贵的计算设备,而是倾向于设计具有成本效益的快速神经网络,降低计算复杂度࿰

http://www.lryc.cn/news/39827.html

相关文章:

  • Nginx常见用法
  • MySQL存储引擎和日志管理
  • Arduino 驱动DS1307时钟模块使用介绍
  • 为什么 Python 没有 main 函数?
  • 【无标题】使用Bibtex4word 整理毕业论文参考文献
  • 19--网络API(java版)
  • ElasticSearch - 分片内部原理之动态更新索引、近实时搜索、持久化变更、段合并
  • 模拟数据采集卡之ADCTDC 模拟时间/数字转换器组合应用选型指南
  • R语言编程基础
  • 2023-03-15:屏幕录制并且显示视频,不要用命令。代码用go语言编写。
  • STM32外设-DMA
  • 【面试题】面试官:如果后端给你 1w 条数据,你如何做展示?
  • 第十二届蓝桥杯省赛详解
  • ssh创建秘钥对
  • JS中sort()方法返回值?
  • 07从零开始学Java之如何正确的编写Java代码?
  • Python学习笔记14:网络编程
  • 初入了解——什么是VUE
  • 代码规范(C++)
  • React教程详解四(hooks、pureComponent、Context通信、错误边界、children props与render props)
  • 【Spring从成神到升仙系列 二】2023年再不会 IOC 源码,就要被淘汰了
  • 菜鸟的进阶--手写一个小型dubbo框架
  • js逆向爬取某音乐网站某歌手的歌曲
  • 为什么软件测试面试了几个月都没有offer,从HR角度分析
  • DC-7 靶场学习
  • 深入理解JavaScript的事件冒泡与事件捕获
  • 格密码学习笔记(六):格中模运算
  • 【C++】非常重要的——多态
  • 发票账单很多?python助你批量完成数据提取
  • [闪存2.1] NAND FLASH特性串烧 | 不了解闪存特性,你能用好闪存产品吗?