当前位置: 首页 > news >正文

自动驾驶高效预训练--降低落地成本的新思路(AD-PT)

自动驾驶高效预训练--降低落地成本的新思路

  • 1. 之前的方法
  • 2. 主要工作——面向自动驾驶的点云预训练
    • 2.1. 数据准备

出发点:通过预训练的方式,可以利用大量无标注数据进一步提升3D检测

  • https://arxiv.org/pdf/2306.00612.pdf

1. 之前的方法

1.基于对比学习的方法——利用关联帧信息构建正样本对

  • 利用不同视角对应的点作为positive pairs:将视角进行一些变换,然后将关联的点作为正样本对,将不相关的点作为负样本对
    • Pointcontrast:Unsupervised pre-training for 3d point cloud understanding (ECCV 2020)
    • Exploring Geometry-aware Contrast and Clustering Harmonization for
      Self-supervised 3D Object Detection (ICCV 2021)
    • ProposalContrast: Unsupervised Pre-training for LiDAR-based 3D Object Detection
  • 利用时序上对应的点作为positive pairs:
    • Spatio-temporal Self-Supervised Representation Learning for 3D Point Clouds(ICCV 2021)
  • 利用不同物体(infrastructure 和 vehicle)上的点作为pairs:
    • CO3: Cooperative Unsupervised 3D Representation Learning for Autonomous Driving(ICLR 2023)

2.基于MAE的方法

  • Voxel上:
    • Voxel-MAE - Masked Autoencoders for Self-Supervised Learning on Automotive Point Clouds
  • BEV上
    • BEV-MAE: Bird’s Eye View Masked Autoencoders for Outdoor Point Cloud Pre-training
  • Hierarchicald空间 :
    • GD-MAE: Generative Decoder for MAE Pre-training on LiDAR Point Clouds (CVPR 2023)

之前工作的缺点:

  • 预训练和finetune是在同一批数据,只不过分上下游;当不一致的时候微调效果一般

所以设想希望:

  • 预训练一个通用的骨干网络,可以接下游很多任务
  • 在增加预训练数据量的时候,下游finetune效果的变得更好

2. 主要工作——面向自动驾驶的点云预训练

在这里插入图片描述
预训练分为两块:

  • 数据处理&准备:
    • 伪标签生成器:对未标注处理(Once数据集待标注是无标注的0.5%)
  • voxel预训练,然后在SECOND、CenterPoint、PV-RCNN上加载

2.1. 数据准备

  • [1]类别注意的伪标签生成
    在这里插入图片描述

  • [2]数据多样性的生成:

    • 1.上/下采样:将点云投影到图像上,将图像作为中间过程,对点云进行上/下采样
      在这里插入图片描述
    • 2.目标尺度缩放:对Bbox进行re-scale
      在这里插入图片描述
  • 在大规模预训练后,在NuScenes数据集上的表现比较差,主要因为类别的不一致性,同时,在继续训练时会抑制预训练的类别激活
    在这里插入图片描述

  • Ped和Cyclist在自动驾驶场景一般检测比较差,标注比较少;在未标注的数据上接近每帧2个label没标注,可以利用上(如下图)
    在这里插入图片描述

  • 对于未标注图片前景物体的判断:采用两路head,分别预测

    • 当两路分支的结果分别高于一定的阈值,并且俩路定位距离比较近,判断为前景
    • 加入Consistency loss
      在这里插入图片描述
http://www.lryc.cn/news/224072.html

相关文章:

  • Spring笔记(四)(黑马)(web层解决方案-SpringMVC)
  • 企业如何实现高效运转?工单管理系统有什么特点和优势?
  • 工业摄像机参数计算
  • Android系统中设置TextView的行间距
  • 嵌入式养成计划-47----QT--基于QT的OpenCV库实现人脸识别功能
  • MySQL(12):MySQL数据类型
  • 哪款手机便签软件支持存储录音文件并支持转文字?
  • Health Kit申请验证有问题?解决方案全解析
  • 2007-2022年上市公司工业机器人渗透度数据
  • k8s基础环境部署
  • 家用工作站方案:ThinkBook 14 2023 版
  • 电脑篇——本地串口转TCP,TCP转虚拟串口,网络调试助手,串口调试助手
  • igbt好坏判断方法有哪些?万用表怎么测试igbt的好坏?
  • Android UI 开发·界面布局开发·案例分析
  • 2023-11-06 monetdb-事务-insert-delta缓存-分析
  • ubuntu 22.04 flameshot 截图异常的问题
  • 正点原子嵌入式linux驱动开发——Linux WIFI驱动
  • React中的“状态”(state)和“属性”(props)的区别
  • 棋牌室电脑计时灯控,棋牌室计时灯控安装,佳易王计时计费管理系统软件
  • P02项目诊断报警组件(学习操作日志记录、单元测试开发)
  • 【ARM Trace32(劳特巴赫) 使用介绍 2 - Veloce 环境中使用trace32 连接 Cortex-M33】
  • 服务器硬件有哪些组成
  • 【Git】Git基础命令操作速记
  • 使用CDN有什么好处?
  • 11.7加减计数器,可置位~,数字钟分秒,串转并,串累加转并,24位串并128,流水乘法器,一些乘法器
  • 【模型推理优化学习笔记】CUDA加速矩阵乘计算
  • 第三届 “鹏城杯”(初赛)
  • React Hooks为什么要在顶层使用?
  • Vscode Vim自动切换
  • C语言初学1:详解#include <stdio.h>