当前位置: 首页 > news >正文

RT-DTER 引入用于低分辨率图像和小物体的新 CNN 模块 SPD-Conv

在这里插入图片描述

论文地址:https://arxiv.org/pdf/2208.03641v1.pdf
代码地址:https://github.com/labsaint/spd-conv

卷积神经网络(CNN)在图像分类、目标检测等计算机视觉任务中取得了巨大的成功。然而,在图像分辨率较低或对象较小的更困难的任务中,它们的性能会迅速下降。
这源于现有CNN体系结构中一个有缺陷但却很常见的设计,即使用strided convolution和/或池化层,这导致了细粒度信息的丢失和较低效率的特征表示的学习。为此,我们提出了一种新的CNN模块,称为SPD-Conv,以取代每个strided convolution和每个池化层(从而完全消除了它们)。SPD-Convspace-to-depth (SPD)层和non-strided convolution(Conv)层组成,可以应用于大多数CNN架构。
我们在两个最具代表性的计算机视觉任务下解释了这种新的设计:目标检测和图像分类。然后,我们通过将SPD-Conv应用于YOLOv5

http://www.lryc.cn/news/227746.html

相关文章:

  • Folw + Room 实现自动观察数据库的刷新
  • 黑马程序员微服务Docker实用篇
  • 虚拟化服务器+华为防火墙+kiwi_syslog访问留痕
  • FlinkSQL聚合函数(Aggregate Function)详解
  • TensorFlow学习笔记--(3)张量的常用运算函数
  • RT-Thread:嵌入式实时操作系统的设计与应用
  • SpringBoot学习笔记-创建菜单与游戏页面(下)
  • STM32一
  • GPT-4 Turbo Assistants API
  • day08_回顾与课程概括
  • iptables、netfilter、firewalld、ufd简单介绍
  • Python基础入门例程53-NP53 前10个偶数(循环语句)
  • v-bind和v-model
  • Adobe premiere裁剪视频尺寸并转为GIF格式
  • 关于react输入框回显问题
  • 案例续集留言板
  • 72 内网安全-域横向CSMSF联动及应急响应初识
  • Leetcode—20.有效的括号【简单】
  • Leetcode—剑指OfferII LCR 019.验证回文串II【简单】
  • Mac电脑配置Flutter开发环境
  • QTableView如何清空数据保留表头
  • [工业自动化-17]:西门子S7-15xxx编程 - 软件编程 - PLC编程语言以及与嵌入式编程的比较
  • 云原生微服务架构及实现技术
  • Uniapp语言切换动态修改Js文件
  • GetSimple CMS忘记密码
  • 数据分析面试题1
  • 数据跨领域应用实例—车辆通行大数据应用场景(二)
  • Dart笔记:build_runner-用于 Dart 代码生成和模块化编译的构建系统
  • Ubuntu显示毫秒级时间
  • 模板——“C++”