当前位置: 首页 > news >正文

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts

pdf

  • Text-to-3D任务中,对3D模型外观的控制不强,本文提出IPDreamer来解决该问题。
  • 在NeRF Training阶段,IPDreamer根据文本用ControlNet生成参考图,并将参考图作为Zero 1-to-3的控制条件,用基于Zero 1-to-3的SDS损失生成粗NeRF。
  • 在Mesh Training阶段,IPDreamer将NeRF用DMTet转换为3D Mesh,并分别优化Mesh的几何与纹理。1)用参考图的法向图编码作为控制信号,用IPSD (Image Prompt Score Distillation) 优化3D Mesh的几何;2)用渲染rgb图像编码(和法向图差异)作为控制信号,用IPSD优化3D Mesh的纹理。
  • 将Text-to-3D任务,转换为单图重建任务,实现了更好的外观控制。

目录

Method

NeRF Training

Mesh Training

Experiments

Some Results

​编辑Comparison with SOTA Text-to-3D Methods


Method

NeRF Training

  • Image Generation. 给定文本描述和控制条件,本文用ControlNet生成参考图片。
  • Training of the Coarse NeRF Model. 给定参考图片,本文用基于Zero 1-to-3的SDS损失生成粗NeRF。

Mesh Training

  • Mesh Extraction. 给定粗NeRF,本文用DMTet将其转换为3D Mesh。3D Mesh由顶点V和四面体T(tetrahedrons)组成。每个顶点包含一个signed distance field (SDF) 值s_i \in S和形变值\Delta{v_{i}} \in \Delta V组成。\Delta{v_{i}}描述了相较于初始正则坐标的变换。本文基于IPSD优化\Delta V, S, \theta
  • Geometry Optimization. Fantasia3D和ProlificDreamer用SDS优化3D Mesh的法向图,实现几何优化。但常用扩散模型缺少法向图的训练数据,导致几何优化效果不佳。为解决该问题,本文引入法向图编码y_n = \varepsilon_{\mathrm{image}}(I_n),其中\varepsilon_{\mathrm{image}}是IP-Adapter的denosing model。IPSD几何损失表达如下:

  • Texture Optimization. 首先,提取参考图像编码y_{\mathrm{rgb}} = \varepsilon_{\mathrm{image}}(I_{\mathrm{rgb}})。其次,计算渲染角度和参考角度的法向图编码,并计算差值得到\delta_{geo}。这一步的目的是希望用y_{rgb} + \delta_{geo}来表征任意渲染角度图像的图像编码。IPSD纹理损失表达如下:

Experiments

Some Results

Comparison with SOTA Text-to-3D Methods

http://www.lryc.cn/news/194179.html

相关文章:

  • 深入理解React中的useEffect钩子函数
  • 数字化时代的财务管理:挑战与机遇
  • 网络通信协议-HTTP、WebSocket、MQTT的比较与应用
  • 【深度学习】深度学习实验四——循环神经网络(RNN)、dataloader、长短期记忆网络(LSTM)、门控循环单元(GRU)、超参数对比
  • DB2分区表详解
  • 基本地址变换机构
  • 以单颗CMOS摄像头重构三维场景,维悟光子发布单目红外3D成像模组
  • Jinja2模板注入 | python模板注入特殊属性 / 对象讲解
  • 一致性公式证明
  • allegro中shape的一些基本操作(一)——添加和修改shape
  • HBuilder创建uniapp默认项目导入uview(胎教)
  • C语言基础算法复习
  • PyQt界面里如何加载本地视频以及调用摄像头实时检测(小白入门必看)
  • Ubuntu:VS Code IDE安装ESP-IDF【保姆级】
  • 软考高级系统架构设计师系列之:快速掌握软件工程核心知识点
  • Java基础面试-ArrayList和LinkedList的区别
  • 如何从 Pod 内访问 Kubernetes 集群的 API
  • 计网面试复习自用
  • 【Android 性能优化:内存篇】——WebView 内存泄露治理
  • C++入门(一)
  • C#控制台程序读取输入按键非阻塞方式
  • 小程序框架->框架,视图层,生命周期(逻辑层)
  • Spring framework Day14:配置类的Lite模式和Full模式
  • 公司要做大数据可视化看板,除了EXCEL以外有没有好用的软件可以用
  • 掌握深入挖掘数据本质的方法
  • MyBatisPlus的学习项目页面
  • 基于EtherCAT的机器人多轴同步运动控制
  • 彩虹易支付 9.27 最新版加订单查询 sy 更新版
  • python树状打印项目路径
  • mysql误删误操作恢复数据,比传统方式和binlog2sql更快速用的恢复方式-reverse_sql恢复数据(单表多表)