(CVPR2023)Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

date
Jun 4, 2023
Last edited time
Jun 4, 2023 08:20 AM
status
Published
slug
Diffusion-SDF论文阅读
tags
DL
DDPM
3D
summary
type
Post
Field
Plat
💡
没什么意思
notion image
本文介绍了一种名为Diffusion-SDF的文本到形状合成方法,能够根据文本输入生成、完成和修改3D形状。以前的方法在 3D 数据表示和形状生成方面都缺乏灵活性,因此无法生成符合给定文本描述的高度多样化的 3D 形状。
为了解决这个问题,我们提出了一个 SDF 自动编码器和体素化扩散模型来学习和生成 3D 形状的体素化符号距离场 (SDF) 的表示。具体来说,我们设计了一种新颖的 UinU-Net 架构,该架构在标准 U-Net 架构中植入了一个以局部为中心的内部网络,从而可以更好地重建与补丁无关的 SDF 表示。
在本文中,我们提出了基于截断符号距离场 (TSDF) 的文本到形状合成的 Diffusion-SDF 框架。考虑到 3D 形状在局部尺度上具有结构相似性,并且 3D 体素的立方数据量可能导致扩散模型的采样速度较慢,我们提出了一个两阶段分离的生成管道。
notion image
第一阶段是基于补丁的SDF自编码器,将原始的有符号距离场映射为独立于补丁的局部高斯潜在表示。这个阶段的目标是提取局部特征并减少数据量。
第二阶段是体素扩散模型,它捕捉了补丁内部信息以及补丁之间和全局之间的关系。该模型使用U-Net去噪器生成独立于补丁的SDF表示。UinU-Net 在外部 U-Net 骨干网中植入了一个以局部为中心的内部网络,它考虑了 SDF 表示的独立于补丁的先验,以更好地从噪声中重建局部补丁特征。
通过这两个阶段,Diffusion-SDF模型能够根据文本输入生成高质量、多样化的3D形状,并在文本引导下完成和修改3D形状。
notion image

Exp

notion image
notion image

© Lazurite 2021 - 2024