当前位置：首页 > news >正文

MapLocNet由粗到细的定位网络

news 2025/7/5 19:03:04

论文链接

MapLocNet: Coarse-to-Fine Feature Registration for Visual Re-Localization in Navigation Mapshttps://arxiv.org/html/2407.08561v1

问题背景

当前自动驾驶的定位主要依赖于高精度的地图和GPS信号，但在城市环境中，GPS信号易受到多路径传播错误的影响，导致定位不准确。此外，高精度地图的构建和维护成本高昂，难以大规模推广。尽管基于导航地图的方法成本较低，但现有的方法在匹配策略上过于复杂，无法满足实时性要求。

论文旨在提出一种新型的重定位网络MapLocNet，用于在城市环境中实现自动驾驶车辆的精确定位。这种方法不依赖高成本的高精度HD地图，而是使用低成本的导航地图来实现定位，旨在解决现有基于导航地图的定位方法中存在的复杂匹配策略导致的实时性不足的问题。

问题建模

方法的思路主要来源于真实世界中的人类驾驶员定位习惯，通常我们会基于周围的视觉信息，预估我们的大致所处的位置，比如在路的中央，或是十字路口等。然后我们会进一步结合实际空间中的各种高维语义信息，如建筑物，车道线，地标等，来和导航地图进一步匹配得到当前准确的位置。

网络设计

MapLocNet模型包括三个主要模块：BEV模块，地图U-Net模块和神经定位模块。BEV模块用于从环视图像中提取特征并将其转换到鸟瞰视图BEV空间；地图U-Net模块用于处理导航地图，提取地图特征；神经定位模块结合视觉BEV特征和地图特征，通过基于层次化的粗到细的特征融合匹配方法进行特征对齐，实现精确定位。

粗到细的实现

MapLocNet采用的是一种层次化的粗到细的特征学习策略，首先用低分辨率大尺寸的地图输入和当前的BEV特征做融合编码学习这一块用的是ViT，编码后做出一个粗略的定位偏移预测，然后在较高分辨率上进行精细调整，再跑一遍ViT，这个阶段和前一个阶段所用的模块是一样的，也是输出偏移的预测。目的是以此来提高定位的准确性和速度。此外，该方法还引入了其他任务的监督，即将感知BEV的分割任务作为姿态预测的辅助目标，希望以此监督定位任务的学习，进一步提高了定位的准确性。

查看全文

http://www.lryc.cn/news/485078.html