当前位置: 首页 > news >正文

3D点云目标检测:VoxelNex解读

VoxelNext

  • 通用检测器 vs VoxelNext
  • 一、3D稀疏卷积模块
    • 1.1、额外的两次下采样
      • 消融实验结果
      • 代码
    • 1.2、稀疏体素删减
      • 消融实验:
      • 代码
  • 二、稀疏体素高度压缩
    • 代码
  • 三、稀疏预测head

通用检测器 vs VoxelNext

一、3D稀疏卷积模块

1.1、额外的两次下采样

使用通用的3D sparse conv,包含4个stage,每个stage穿插常规稀疏卷积和子流形稀疏卷积,得到的特征分别为F1、F2、F3、F4。

VoxelNext的backbone在原有的基础上再增加两次下采样,分别得到F5,F6,目的是增大感受野

消融实验结果

从实验结果来看,直接使用原始的4stage结构接检测头后精度下降8.9,多加两次下采样后精度提升9.5。且从可视化效果来看额外的下采样使感受野确实增大了。

代码

1.2、稀疏体素删减

在backbone的第2个stage开头会有一个下采样,Voxelnext在下采样的时候计算体素的重要性,根据比例删掉不重要的体素。

重要性判断公式:直接计算体素所有通道特征的均值,然后经过一个sigmoid,输出的sorce作为重要程度。

消融实验:

前三次下采样使用删减策略,且删减比例为0.5.

代码

DynamicFocalPruningDownsample实现在pruning_block.py中。

二、稀疏体素高度压缩

进入检测head前,直接将F4、F5、F6体素压缩合并。

计算公式:

代码

三、稀疏预测head

与常规的3D目标检测head不同,Voxelnext直接使用稀疏的体素进行预测,训练的时候,靠近GT中心点的体素作为正样本,使用focal loss监督,可视化和统计发现,用来预测box的voxel不一定在box中心点,如下图

统计发现有72.8%的box的query voxel都不在中心点。

推理时使用sparse max pooling 代替NMS,具体过程是先对稀疏的Voxel预测一个score,再使用稀疏卷积的操作做max pooling,只保留max pool kernel里得分最高的voxel。

http://www.lryc.cn/news/249973.html

相关文章:

  • opencv-利用DeepLabV3+模型进行图像分割去除输入图像的背景
  • 中国版的 GPTs:InsCode AI 生成应用
  • MySQL 学习笔记(刷题篇)
  • windows系统如何配置yarn环境变量
  • 视频中的文字水印怎么去除?这三招学会轻松去视频水印
  • Java项目学生管理系统二查询所有
  • 27.Spring如何避免在并发下获取不完整的Bean?
  • 浅析SD-WAN企业组网部署中简化网络运维的关键技术
  • 【Rust】快速教程——自定义类型、数字转枚举、Cargo运行
  • python 实现 AIGC 大语言模型中的概率论:生日相同问题的代码场景模拟
  • SD-WAN组网中的CPE及云服务CPE部署方法
  • 理解BatchNormalization层的作用
  • uniapp实现文件预览过程
  • 深度学习-学习笔记记录
  • 程序员养生之道:延寿不忘初心——延寿必备
  • 使用Docker安装部署Swagger Editor并远程访问编辑API文档
  • Nacos 2.X核心架构源码剖析
  • C语言--每日选择题--Day31
  • chrome vue devTools安装
  • Spring Security 6.x 系列(7)—— 源码分析之Builder设计模式
  • PyQt6 中自定义浮点型滑块类
  • 笔记,B+树
  • 代码随想录刷题题Day2
  • 【JAVA面向对象编程】--- 探索子类如何继承父类
  • 从浏览器控制台发送get,post请求
  • 海外问卷调查怎么批量做?可以用指纹浏览器吗?
  • HarmonyOS 位置服务开发指南
  • ThinkPHP6学生选课管理系统
  • uniapp如何与原生应用进行混合开发?
  • Csharp(C#)无标题栏窗体拖动代码