当前位置：首页 > news >正文

3D点云目标检测：VoxelNex解读

news 2025/8/30 9:47:22

VoxelNext

通用检测器 vs VoxelNext
一、3D稀疏卷积模块
- 1.1、额外的两次下采样
- - 消融实验结果
  - 代码
- 1.2、稀疏体素删减
- - 消融实验：
  - 代码
二、稀疏体素高度压缩
- 代码
三、稀疏预测head

通用检测器 vs VoxelNext

一、3D稀疏卷积模块

1.1、额外的两次下采样

使用通用的3D sparse conv，包含4个stage，每个stage穿插常规稀疏卷积和子流形稀疏卷积，得到的特征分别为F1、F2、F3、F4。

VoxelNext的backbone在原有的基础上再增加两次下采样，分别得到F5，F6，目的是增大感受野

消融实验结果

从实验结果来看，直接使用原始的4stage结构接检测头后精度下降8.9，多加两次下采样后精度提升9.5。且从可视化效果来看额外的下采样使感受野确实增大了。

代码

1.2、稀疏体素删减

在backbone的第2个stage开头会有一个下采样，Voxelnext在下采样的时候计算体素的重要性，根据比例删掉不重要的体素。

重要性判断公式：直接计算体素所有通道特征的均值，然后经过一个sigmoid，输出的sorce作为重要程度。

消融实验：

前三次下采样使用删减策略，且删减比例为0.5.

代码

DynamicFocalPruningDownsample实现在pruning_block.py中。

二、稀疏体素高度压缩

进入检测head前，直接将F4、F5、F6体素压缩合并。

计算公式：

代码

三、稀疏预测head

与常规的3D目标检测head不同，Voxelnext直接使用稀疏的体素进行预测，训练的时候，靠近GT中心点的体素作为正样本，使用focal loss监督，可视化和统计发现，用来预测box的voxel不一定在box中心点，如下图

统计发现有72.8%的box的query voxel都不在中心点。

推理时使用sparse max pooling 代替NMS，具体过程是先对稀疏的Voxel预测一个score，再使用稀疏卷积的操作做max pooling，只保留max pool kernel里得分最高的voxel。

查看全文

http://www.lryc.cn/news/249973.html

opencv-利用DeepLabV3+模型进行图像分割去除输入图像的背景

中国版的 GPTs：InsCode AI 生成应用

MySQL 学习笔记（刷题篇）

windows系统如何配置yarn环境变量

视频中的文字水印怎么去除？这三招学会轻松去视频水印

Java项目学生管理系统二查询所有

27.Spring如何避免在并发下获取不完整的Bean?

浅析SD-WAN企业组网部署中简化网络运维的关键技术

【Rust】快速教程——自定义类型、数字转枚举、Cargo运行

python 实现 AIGC 大语言模型中的概率论：生日相同问题的代码场景模拟

SD-WAN组网中的CPE及云服务CPE部署方法

理解BatchNormalization层的作用

uniapp实现文件预览过程

深度学习-学习笔记记录

程序员养生之道：延寿不忘初心——延寿必备

使用Docker安装部署Swagger Editor并远程访问编辑API文档

Nacos 2.X核心架构源码剖析

C语言--每日选择题--Day31

chrome vue devTools安装

Spring Security 6.x 系列（7）—— 源码分析之Builder设计模式

PyQt6 中自定义浮点型滑块类

笔记，B+树

代码随想录刷题题Day2

【JAVA面向对象编程】--- 探索子类如何继承父类

从浏览器控制台发送get，post请求

海外问卷调查怎么批量做？可以用指纹浏览器吗？