当前位置: 首页 > news >正文

⭐CVPR2025 建模部件级动态的 4D 重建框架

⭐CVPR 顶会论文精读|PartRM:建模部件级动态的 4D 重建框架

📄论文题目:PartRM: Modeling Part-Level Dynamics with Large Cross-State Reconstruction Model

✍️作者及机构:Mingju Gao等(清华大学等)

🧩面临问题:当前部件级动态建模方法存在实用性不足的问题。一方面,现有方法如 Puppet-Master 依赖 2D 视频扩散模型,仅输出单视角视频,无法提供模拟器所需的 3D 表示,还需额外重建模型易引入误差;另一方面,扩散去噪过程耗时久,难以满足实时反馈需求,且 4D 动态数据稀缺,模型微调时易发生灾难性遗忘,丢失预训练的外观和几何建模能力134。

🎯创新点及其具体研究方法:

1️⃣ 提出 PartRM 4D 重建框架:基于大型 3D 高斯重建模型,实现外观、几何和部件级运动的同步建模。以单视角图像和用户拖拽指令为输入,通过前馈方式生成 3D 高斯表示,直接输出下一状态的 3D 结构,支持多视角渲染,相比 Puppet-Master 提升了 PSNR 并显著加快推理速度256。

2️⃣ 构建 PartDrag-4D 数据集:基于 PartNet-Mobility 数据集,选取 738 个物体(涵盖 8 个类别),将每个物体的可动部件在极端位置间分为 6 个运动阶段,生成 20,548 个状态,每个状态渲染 12 个视角图像,同时精准采样拖拽点并过滤遮挡点,解决 4D 数据稀缺问题791011。

3️⃣ 多尺度拖拽嵌入模块:对输入及传播后的拖拽点,通过傅里叶嵌入和 3 层 MLP 编码起点与终点坐标,生成对应 UNet 各下采样块空间维度的拖拽图,将其与网络输出 concatenate 后送入卷积层,增强模型对不同粒度拖拽运动的识别能力。

4️⃣ 两阶段训练策略:第一阶段(运动学习)以预训练网络推断的目标状态 3D 高斯参数为监督,通过 L2 损失优化,专注学习运动动态;第二阶段(外观学习)以目标视角渲染图像为监督,采用 MSE、LPIPS 和 alpha 通道损失联合优化,避免灾难性遗忘,兼顾运动与外观建模。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/625820.html

相关文章:

  • 数据安全治理——解读67页2024金融数据安全治理白皮书【附全文阅读】
  • 路由器详解
  • Java JDK官网下载渠道
  • 使用 Ansys Discovery 探索外部空气动力学
  • 《算法导论》第 32 章 - 字符串匹配
  • 【深度学习计算性能】06:多GPU的简洁实现
  • 接口性能测试工具 - JMeter
  • JB4-9-任务调度
  • 《飞算Java AI使用教程:从安装入门到实践项目》
  • 12.3.2设置背景色12.3.3 创建设置类12.4 添加飞船图像 12.4.1 创建Ship 类 12.4.2 在屏幕上绘制飞船
  • 用MacBook进行LLM简单人类指令微调
  • 蓝凌EKP产品:JSP 项目性能基于业务维度的 JS 压缩合并方案优化实战
  • 供水设备智慧化管理物联网解决方案:远程监控与运维
  • 操作系统:多线程、进程管理、内存分配、任务调度等
  • IC验证 AHB-RAM 项目(二)——接口与事务代码的编写
  • 比赛准备之环境配置
  • Nginx前后端分离反代(VUE+FastAPI)
  • 卫生许可证识别技术:通过OCR与NLP实现高效合规管理,提升审核准确性与效率
  • Apache IoTDB 大版本升级记录(成熟的2.0.2版本)
  • 汇编语言学习2---GNU Debugger (GDB)
  • PiscCode迅速集成YOLO-Pose 实现姿态关键点轨迹跟踪应用
  • 疏老师-python训练营-Day50预训练模型+CBAM注意力
  • PHP如何使用JpGraph生成折线图?
  • NVIDIA 优化框架:Jetson 平台 PyTorch 安装指南
  • vue,H5车牌弹框定制键盘包括新能源车牌
  • 楼宇自控系统的应用,已然成为智能建筑行业发展方向
  • 【网络运维】Playbook部署文件:Files模块库&JINJA2模板
  • 18650锂电池自动化生产线:智能集成提升制造效能
  • Qt猜数字游戏项目开发教程 - 从零开始构建趣味小游戏
  • 厚板数控矫平机的“第三堂课”——把视角拉远,看看它如何重塑整条制造链