当前位置: 首页 > news >正文

MapLocNet由粗到细的定位网络

论文链接

MapLocNet: Coarse-to-Fine Feature Registration for Visual Re-Localization in Navigation Mapsicon-default.png?t=O83Ahttps://arxiv.org/html/2407.08561v1

问题背景

当前自动驾驶的定位主要依赖于高精度的地图和GPS信号,但在城市环境中,GPS信号易受到多路径传播错误的影响,导致定位不准确。此外,高精度地图的构建和维护成本高昂,难以大规模推广。尽管基于导航地图的方法成本较低,但现有的方法在匹配策略上过于复杂,无法满足实时性要求。

论文旨在提出一种新型的重定位网络MapLocNet,用于在城市环境中实现自动驾驶车辆的精确定位。这种方法不依赖高成本的高精度HD地图,而是使用低成本的导航地图来实现定位,旨在解决现有基于导航地图的定位方法中存在的复杂匹配策略导致的实时性不足的问题。

问题建模

方法的思路主要来源于真实世界中的人类驾驶员定位习惯,通常我们会基于周围的视觉信息,预估我们的大致所处的位置,比如在路的中央,或是十字路口等。然后我们会进一步结合实际空间中的各种高维语义信息,如建筑物,车道线,地标等,来和导航地图进一步匹配得到当前准确的位置。

网络设计

MapLocNet模型包括三个主要模块:BEV模块,地图U-Net模块和神经定位模块。BEV模块用于从环视图像中提取特征并将其转换到鸟瞰视图BEV空间;地图U-Net模块用于处理导航地图,提取地图特征;神经定位模块结合视觉BEV特征和地图特征,通过基于层次化的粗到细的特征融合匹配方法进行特征对齐,实现精确定位。

粗到细的实现

MapLocNet采用的是一种层次化的粗到细的特征学习策略,首先用低分辨率大尺寸的地图输入和当前的BEV特征做融合编码学习这一块用的是ViT,编码后做出一个粗略的定位偏移预测,然后在较高分辨率上进行精细调整,再跑一遍ViT,这个阶段和前一个阶段所用的模块是一样的,也是输出偏移的预测。目的是以此来提高定位的准确性和速度。此外,该方法还引入了其他任务的监督,即将感知BEV的分割任务作为姿态预测的辅助目标,希望以此监督定位任务的学习,进一步提高了定位的准确性。 

http://www.lryc.cn/news/485078.html

相关文章:

  • 【Docker】Mac安装Docker Desktop导致磁盘剩余空间较少问题如何解决?
  • 构建客服知识库:企业效率提升的关键步骤
  • java-Day06 内部类 Lambda表达式 API
  • Springboot配置全局异常通用返回
  • 计算机视觉在自动驾驶汽车中的应用
  • wordpress functions文件的作用及详细说明
  • Cellebrite VS IOS18Rebooting
  • [每日一氵] PySpark 的 log GC 部分是什么意思
  • Transformer中的算子:其中Q,K,V就是算子
  • JWTUtil工具类
  • 【eNSP】企业网络架构实验——vlan间的路由通信(三)
  • 软件测试基础二十九 (接口测试 mock)
  • Learning RAG and Ragas
  • Java项目实战II基于微信小程序的实习记录(开发文档+数据库+源码)
  • GIT将源码推送新分支
  • Python习题 250:删除空文件夹
  • 基本数据类型:Kotlin、Dart (Flutter)、Java 和 C++ 的比较
  • 源码解析-Spring Eureka(更新ing)
  • python调用百度通用翻译API
  • Timeline动画「硬切」的问题
  • CentOS 9 配置网卡
  • redis7.x源码分析:(2) adlist双向链表
  • KUKU FM 音频Linux平台免费下载工具
  • 《Django 5 By Example》阅读笔记:p105-p164
  • 网络延迟对Python爬虫速度的影响分析
  • 微信小程序内嵌h5页面(uniapp写的),使用uni.openLocation无法打开页面问题
  • 创建一个简单的基于STM32的FreeRTOS应用
  • 【Revit二次开发】创建Ribbon选项卡与带图标的按钮
  • Win11 终端执行 python xxx.py 没反应
  • 使用视频提升应用在 App Store 中的推广效果