当前位置: 首页 > news >正文

为何前馈3DGS的边界总是“一碰就碎”?PM-Loss用“3D几何先验”来解

文章链接: https://arxiv.org/abs/2506.05327
项目主页: https://aim-uofa.github.io/PMLoss
代码链接: https://github.com/aim-uofa/PM-Loss

在新视角合成(Novel View Synthesis, NVS)技术飞速发展的今天,3D高斯泼溅(3D Gaussian Splatting, 3DGS)以其出色的实时渲染能力和照片级的视觉效果,成为了该领域的主流技术。为了摆脱传统3DGS“逐场景优化”的束缚,前馈式(Feed-forward)3DGS应运而生,它仅需一次网络推理即可完成场景重建,极大地提升了应用效率。

然而,一个长期存在但常被忽视的问题,正制约着前馈式3DGS的质量上限:

几何表示的局限性。当前模型普遍依赖预测的2D深度图反投影来构建三维高斯点云。但深度图在物体边界处存在天然的不连续性,这种瑕疵在被上投影至三维空间时会被放大,导致生成的几何体在边缘区域出现破碎、空洞和漂浮物,严重影响了最终的渲染质量。

为了攻克这一难题,本文提出了 PM-Loss,一种新颖的、即插即用的正则化损失。它巧妙地利用了大型3D重建模型生成的“点图”(Pointmap)作为几何先验,在训练过程中直接对三维空间中的几何进行约束,从根本上提升了模型的几何准确性。实验表明,MVSplat 和 DepthSplat 等主流模型在应用 PM-Loss 后,在 DL3DV 和 RealEstate10K 数据集上重建出的高斯点云基本消除了外围浮点。同时在渲染效果上也取得了超过 2dB 的PSNR提升 ,点云在边界区域可视化效果变得明显更加清晰和规整 。

核心症结:不完美的“深度基石”

深入探究前馈式3DGS的工作流程,我们发现其核心瓶颈在于几何重建的监督方式。模型通过标准的2D渲染损失(如L2, LPIPS)进行优化,这种监督方式虽然能保证整体画面的相似性,却难以对三维空间的几何结构进行有效约束。 这导致了两个主要问题:

1.边界伪影 (Boundary Artifacts):深度图在物体轮廓、前景与背景交界处极易产生错误预测,这些错误被直接转化为三维空间中位置不准的高斯点。
2.几何不一致 (Geometric Inconsistency):仅依赖2D图像监督,模型难以学习到多视图之间连贯、一致的几何信息,导致三维结构缺乏平滑性和完整性。
这种基于不完美“深度基石”的重建方式,是导致渲染结果出现视觉瑕疵的根本原因。

PM-Loss登场:引入3D空间“几何标尺”

为了解决上述问题,本文不再局限于2D图像空间,而是引入了直接的3D几何监督。PM-Loss的核心思想是:借助一个强大的外部“几何专家”来指导3DGS模型的几何学习

这个“专家”就是由预训练的大型3D重建模型(如VGGT)生成的点图(Pointmap)。点图为场景中的每个像素点直接提供了三维世界坐标,相比于单一的深度值,它包含了更丰富、更平滑的几何信息。

PM-Loss的工作流程可概括为以下两步:
1.高效对齐 (Efficient Alignment) :在训练的每一步,将3DGS模型预测的高斯点云中心,与由点图构成的目标点云进行对齐。得益于两者像素级别的天然对应关系,可采用高效的Umeyama算法在毫秒间完成对齐,避免了传统ICP等算法的巨大开销。
2.3D空间正则化 (3D-Space Regularization) :对齐后,通过Chamfer距离计算两个点云之间的差异,并将其作为一项正则化损失(即PM-Loss)加入到总损失函数中。这相当于在三维空间中引入了一把“几何标尺”,惩罚那些偏离了平滑几何先验的预测,引导模型学习到更准确、更完整的3D结构。

作为一个纯粹的训练期损失,PM-Loss无需修改模型架构,且在推理时零开销,保证了原有模型的效率。

实测效果:边界更清晰,伪影去无踪

本文在多个主流前馈3DGS模型(如DepthSplat, MVSplat)及大规模数据集(DL3DV, RealEstate10K)上验证了PM-Loss的有效性。

  • 几何质量的根本性优化:通过可视化3D高斯点云,发现PM-Loss能显著提升几何体的规整度和完整性,使其更贴近真实的场景结构。

  • 渲染质量显著提升:PM-Loss为所有基线模型带来了稳定且可观的性能增益。在同样设置下,PSNR指标平均提升超过2dB,LPIPS和SSIM指标也得到了一致改善。

  • 视觉效果肉眼可见的改善:从定性对比中可以清晰看到,经PM-Loss优化后的模型,在处理物体边缘、复杂遮挡和背景区域时表现得更加出色。原先的黑色空洞、扭曲边界和漂浮噪点得到了有效抑制,整体画面更干净、更真实。

总结

研究指出了当前前馈式3DGS模型中一个关键却未被充分解决的问题:由2D深度表示局限性所引发的几何质量瓶颈。本文提出的PM-Loss,通过一种巧妙而高效的方式,将大型3D重建模型的几何先验知识“蒸馏”到3DGS模型的训练过程中。作为一个轻量级、即插即用且无推理开销的正则化损失,PM-Loss为提升前馈式3DGS的重建质量提供了一个实用且有效的解决方案。我们相信,这种跨模型、跨范式借鉴先验知识的思路,将为未来的三维视觉研究带来更多启发。

参考文献

[1] Revisiting Depth Representations for Feed-Forward 3D Gaussian Splatting

http://www.lryc.cn/news/571167.html

相关文章:

  • Mac 安装JD-GUI
  • 低轨导航 | 低轨卫星导航PNT模型,原理,公式,matlab代码
  • 软件工程:流程图如何画?
  • Python 爬虫入门 Day 5 - 使用 XPath 进行网页解析(lxml + XPath)
  • springboot使用kafka
  • Jmeter的三种参数化方式详解
  • web前端开发核心基础:Html结构分析,head,body,不同标签的作用
  • Java内存模型与线程
  • Anaconda 使用
  • 力扣经典算法篇-17-反转字符串中的单词(逆序遍历,数组分割,正则表达式)
  • 4_STM32F103ZET6芯片系统架构和寄存器
  • 通过自适应训练样本选择弥合基于锚点和无锚点检测之间的差距之ATSS论文阅读
  • 【论文阅读】BACKDOOR FEDERATED LEARNING BY POISONING BACKDOOR-CRITICAL LAYERS
  • Matlab自学笔记五十九:符号变量的代入和替代subs精讲
  • Windows10安装WSL Ubuntu
  • 设计模式:单例模式多种方式的不同实现
  • vue中diff算法的原理
  • 把springboot打包为maven可引入的jar
  • Maven 的 settings.xml详解
  • 深度学习中常见的激活函数分析
  • Android Studio Jetpack Compose毛玻璃特效按钮
  • 【数据结构】栈和队列详解
  • 线性放大器设计方案:248-双极性任意波1M带宽400Vpp高压线性放大器
  • 欧拉安装vboxlinuxadditions时,出错
  • 第九章——8天Python从入门到精通【itheima】-95~96-Python的异常模块与包(自定义模块并导入+自定义Python包)
  • MySQL 命令行的核心操作命令详解
  • 资深Java工程师的面试题目(一)微服务
  • 如何高效分享WordPress博客文章
  • Sparse4D: 稀疏范式的端对端融合
  • (100)课126: 间隙锁临键锁,是为了锁定索引B+树里叶节点之间的间隙,不允许别的事务在这些间隙里插入新的叶节点,从而阻止幻读