当前位置: 首页 > news >正文

单幅图像合成 360° 3D 场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。

论文介绍了一种从单幅图像合成 360° 3D 场景的新方法。该方法以连贯的方式生成全景图及其相应的深度,解决了现有最先进方法(如 LucidDreamer 和 WonderJourney 的局限性。这些方法按照生成轨迹依次添加细节,通常在循环回输入图像时导致可见的接缝。相比之下,该方法可确保整个 360° 场景的一致性,如图所示。黄色条显示每个结果中与输入相对应的区域。

相关链接

  • 论文:http://arxiv.org/abs/2412.04827v1

  • 主页:https://people.engr.tamu.edu/nimak/Papers/PanoDreamer

  • 代码:https://github.com/avinashpaliwal/PanoDreamer

论文介绍

PanoDreamer:从单个图像合成 3D 全景

论文提出一种从单个输入图像生成连贯 360° 3D 场景的新颖方法PanoDreamer。与顺序生成场景的现有方法不同,该方法将问题描述为单图像全景和深度估计。一旦获得连贯的全景图像及其相应的深度,就可以通过修复小的遮挡区域并将其投影到 3D 空间来重建场景。论文主要贡献是将单图像全景和深度估计制定为两个优化任务,并引入交替最小化策略来有效解决其目标。该方法在一致性和整体质量方面优于单图像 360° 场景重建的现有技术。

单图像全景生成

论文使用修复扩散模型解决单图像全景生成问题,将其框架为通过交替最小化策略解决的优化任务。在迭代过程中,中心的输入纹理逐渐向外传播。

全景与多重扩散的比较

全景深度估计

与全景图生成类似,使用交替最小化来对齐圆柱形全景图的重叠单眼深度图块,从而能够估计一致的 360° 深度图。

3D 场景与其他方法的比较

将该方法 PanoDreamer(右)与基线方法(左)的渲染进行比较。尝试选择不同的方法和场景!

结论

论文提出了一种从单个输入图像生成 360° 3D 场景的新方法。该方法首先生成全景图及其相应的深度图。在修复遮挡区域后,这些图像用于优化 3DGS 表示,从中可以渲染新视图。为了创建一个连贯且全局一致的全景图,论文将任务设计为具有两个项的优化问题,并通过交替最小化策略有效地解决它。此外,论文提出使用现有单目深度估计方法估计全景图深度的问题作为优化,并使用交替最小化来解决它。大量实验表明,该方法在全景图生成和重建 3D 场景方面都优于最先进的方法。

http://www.lryc.cn/news/504290.html

相关文章:

  • Python课设-谁为影狂-豆瓣数据【数据获取与预处理课设】
  • 关卡选择与布局器
  • 评估一套呼叫中心大模型呼出机器人的投入回报比?
  • 面向对象的 CLI:使用 Fire 简化类和对象的方法暴露 (中英双语)
  • flutter控件buildDragTargetWidget详解
  • 使用webrtc-streamer查看实时监控
  • 【数据分享】2014-2024年我国POI兴趣点数据(免费获取/来源于OSM地图)
  • Leetcode 3389. Minimum Operations to Make Character Frequencies Equal
  • Vite 与 Webpack 的区别
  • 基于32单片机的RS485综合土壤传感器检测土壤PH、氮磷钾的使用(超详细)
  • 【从零开始入门unity游戏开发之——C#篇11】一个标准 C# 程序介绍、新的值类型——枚举
  • vue 签名校验 md5 uuid
  • CSS系列(16)-- 架构与模式详解
  • 【go语言】reflect包与类型推断
  • 3.python运算符
  • 【竞技宝】CS2-上海major:spirit力克MOUZ niko梦碎
  • 【Leetcode 每日一题】3266. K 次乘运算后的最终数组 II
  • etcd集群常见日志
  • 【漫话机器学习系列】005.神经网络的结构(architecture on the neural network)
  • 基于 Couchbase 数据仓库元数据管理的可行性方案
  • SpringBoot:快速构建微服务应用
  • 汽车嵌入式软件构建高效技术团队的全面思考
  • 【跨库查询、多库查询】.NET开源 ORM 框架 SqlSugar 系列
  • 智能人体安全防护:3D 视觉技术原理、系统架构与代码实现剖析
  • 第24周:文献阅读
  • yolov8 转华为昇腾om脚本
  • 分布式事物XA、BASE、TCC、SAGA、AT
  • 域名信息收集(小迪网络安全笔记~
  • 力扣-图论-13【算法学习day.63】
  • 【设计模式】如何用C++实现观察者模式【发布订阅机制】