当前位置: 首页 > news >正文

SLAIM:一个实时的RGB-D NeRF-SLAM系统

图片

SLAIM:一个实时的RGB-D NeRF-SLAM系统与现有的NeRF-SLAM系统相比,我们的方法在跟踪性能上始终表现出更强的竞争力。我们的方法采用体积密度表示,并引入了一种新的KL正则化器在射线终止分布上,将场景几何限制为空隙空间和不透明表面。icon-default.png?t=N7T8https://mp.weixin.qq.com/s/YzUdxIIvgebqpszaL1okLA

01  引言

尽管最近的NeRF-SLAM系统在跟踪和3D重建方面取得了进展,但它们的跟踪性能通常仍然不如传统的SLAM系统。一些最近的工作通过使用高斯金字塔滤波器来平滑输入信号,从而扩大了优化损失函数的吸引域,以避免陷入局部最小值。

本文提出了一种名为SLAIM的基于神经辐射场(NeRF)的鲁棒稠密实时RGB-D SLAM系统,该系统能够在线进行跟踪和建图。作者指出,现有的NeRF-SLAM系统在跟踪性能上通常不如传统的SLAM系统。为了解决这个问题,作者提出了一种新的基于NeRF的粗细粒度跟踪和建图方法。

图片

02  方法

作者提出了一个基于高斯金字塔滤波的粗细粒度跟踪和建图方法。他们首先在重建的图像和真实图像上都应用了高斯金字塔滤波器,以在早期迭代中有效平滑输入信号,从而扩大优化损失函数的吸引域,避免陷入局部最小值。然后,他们通过在多个金字塔层上采样像素,并计算对应的颜色和深度值,来限制NeRF像素重建的范围。

图片

2.1 NeRF pre-requisites

该节介绍了NeRF的预先要求,包括:

· 使用多分辨率哈希网格表示场景几何,并使用两个浅层MLP解码器来估计给定3D输入位置的颜色和密度。

· 定义了射线终止分布w(r),并通过采样方法将其近似为高斯分布。

图片

图片

· 渲染颜色和深度像素时,使用alpha合成沿射线的值。

· 场景被限制在单位立方体内,并且使用固定步长\Delta r进行均匀采样。

图片

2.2 Depth Supervision

该节介绍了使用深度监督的重要性。使用直接对深度值进行回归的方法可能会导致在只有有限视角的区域出现重构错误。因此,作者提出了一种新的方法,通过在射线终止分布上应用KL正则化,使其成为单峰分布,并将其中心对准深度测量。

图片

2.3 Coarse-to-fine Tracking and Mapping

该节提出了一种基于高斯金字塔滤波的粗细粒度跟踪和建图方法。使用高斯金字塔滤波器平滑输入信号,以在早期迭代中扩大优化损失函数的吸引域,避免陷入局部最小值。在重建图像和真实图像上都应用了高斯金字塔滤波器。

· 高斯金字塔滤波:作者在重建的图像和真实图像上都应用了高斯金字塔滤波器,以在早期迭代中有效平滑输入信号,从而扩大优化损失函数的吸引域,避免陷入局部最小值。具体来说,作者在重建图像上使用了卷积滤波器,在真实图像上使用了中值滤波器。

· 像素采样:作者在多个金字塔层上采样像素,并计算对应的颜色和深度值,来限制NeRF像素重建的范围。这个采样范围对应于原始图像的某一感受野。

· 粗细粒度跟踪和建图:作者将这种粗细粒度的策略应用于跟踪和建图过程中。在跟踪过程中,作者首先在粗粒度图像上进行局部束调整,然后在细粒度图像上进行全局束调整,以获得最佳的跟踪和重建结果。在建图过程中,作者首先在粗粒度图像上进行局部优化,然后在细粒度图像上进行全局优化。

图片

03   实验

作者在多个数据集(ScanNet, TUM, Replica)上进行了实验,结果表明,与仅使用粗粒度或细粒度的方法相比,这种联合使用可以获得更好的跟踪和重建性能。

图片

图片

图片

04  结论

本论文介绍SLAIM,一个鲁棒的实时的RGB-D NeRF-SLAM系统,能够在实时中进行在线跟踪和建图。与现有的NeRF-SLAM系统相比,我们的方法在跟踪性能上始终表现出更强的竞争力。我们的方法采用体积密度表示,并引入了一种新的KL正则化器在射线终止分布上,将场景几何限制为空隙空间和不透明表面。我们的解决方案实现了局部和全局束调整,以产生一个稳健(粗细粒度)和准确(KL正则化)的SLAM解决方案。

我们在多个数据集(ScanNet, TUM, Replica)上进行了实验,结果显示,在跟踪和重建准确性方面,我们的方法取得了最先进的结果。我们的方法是第一个在跟踪和3D重建方面同时达到最先进水平的NeRF-SLAM系统。

http://www.lryc.cn/news/341393.html

相关文章:

  • PWN入门之Stack Overflow
  • QT:label标签/进度条的使用
  • 网络初始化配置
  • 在Ubuntu上搭建并通过systemctl管理Minecraft Java版服务器
  • 【C++PCL】点云处理ESF描述符
  • 鸿蒙应用开发系列 篇二:鸿蒙系统开发工具与环境
  • “A”分心得:我的云计算HCIE学习之路
  • 现代信号处理8_递归的最小二乘(CSDN_20240505)
  • 2024年全国保密宣传教育月的主题是()。A.贯彻落实保密法。你我都是护密人B.国家利益高于一切,保密责任重于泰山C.筑牢保密防线,维护国家安全
  • 一个通过照片识别地理位置的应用
  • wordpress外贸独立站建站10要10不要
  • 搬运5款小众,无广告,实用性拉满的软件
  • TCP重传,滑动窗口,流量控制,拥塞控制
  • 云手机对出海企业有什么帮助?
  • Android Studio实现简单的自定义钟表
  • C语言 举例说明循环嵌套
  • 一、ESP32基础知识
  • 我希望未来10年,人工智能可以帮我解决这4件小事
  • 使用jdbc方式操作ClickHouse
  • 百面算法工程师 | 支持向量机——SVM
  • 关于YOLO8学习(一)环境搭建,官方检测模型部署到手机
  • 3.10设计模式——Template Method 模版方法模式(行为型)
  • SQL 基础 | UNION 用法介绍
  • 学习如何使用PyQt5实现notebook功能
  • Python氮氧甲烷乙烷乙烯丙烯气体和固体热力学模型计算
  • 2024-04-30 区块链-以太坊-相关文档
  • 你用过最好用的AI工具有哪些?
  • Amine-PEG-Amine,956496-54-1在生物成像、生物传感器等领域具有广泛的应用
  • 为什么深度学习中减小泛化误差称为“正则化(Regularization)”
  • 【Linux网络编程】2.套接字、网络字节序、IP地址转换函数