(CVPR2023)Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

date

Jun 4, 2023

Last edited time

Jun 4, 2023 08:20 AM

status

Published

slug

Diffusion-SDF论文阅读

tags

DDPM

summary

type

Post

origin

https://www.notion.so/lazurite/CVPR2023-Diffusion-SDF-Text-to-Shape-via-Voxelized-Diffusion-66d7a382d7d6414593b7e25fe708e546?pvs=4

Field

Plat

Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

With the rising industrial attention to 3D virtual modeling technology, generating novel 3D content based on specified conditions (e.g. text) has become a hot issue. In this paper, we propose a...

https://arxiv.org/abs/2212.03293

Li 等 - 2022 - Diffusion-SDF Text-to-Shape via Voxelized Diffusi.pdf

2973.9KB

Li_Diffusion-SDF_Text-To-Shape_via_CVPR_2023_supplemental.pdf

580.6KB

GitHub - ttlmh/Diffusion-SDF: Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

Diffusion-SDF: Text-to-Shape via Voxelized Diffusion - GitHub - ttlmh/Diffusion-SDF: Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

https://github.com/ttlmh/Diffusion-SDF

💡

没什么意思

本文介绍了一种名为Diffusion-SDF的文本到形状合成方法，能够根据文本输入生成、完成和修改3D形状。以前的方法在 3D 数据表示和形状生成方面都缺乏灵活性，因此无法生成符合给定文本描述的高度多样化的 3D 形状。

为了解决这个问题，我们提出了一个 SDF 自动编码器和体素化扩散模型来学习和生成 3D 形状的体素化符号距离场 (SDF) 的表示。具体来说，我们设计了一种新颖的 UinU-Net 架构，该架构在标准 U-Net 架构中植入了一个以局部为中心的内部网络，从而可以更好地重建与补丁无关的 SDF 表示。

在本文中，我们提出了基于截断符号距离场 (TSDF) 的文本到形状合成的 Diffusion-SDF 框架。考虑到 3D 形状在局部尺度上具有结构相似性，并且 3D 体素的立方数据量可能导致扩散模型的采样速度较慢，我们提出了一个两阶段分离的生成管道。

第一阶段是基于补丁的SDF自编码器，将原始的有符号距离场映射为独立于补丁的局部高斯潜在表示。这个阶段的目标是提取局部特征并减少数据量。

第二阶段是体素扩散模型，它捕捉了补丁内部信息以及补丁之间和全局之间的关系。该模型使用U-Net去噪器生成独立于补丁的SDF表示。UinU-Net 在外部 U-Net 骨干网中植入了一个以局部为中心的内部网络，它考虑了 SDF 表示的独立于补丁的先验，以更好地从噪声中重建局部补丁特征。

通过这两个阶段，Diffusion-SDF模型能够根据文本输入生成高质量、多样化的3D形状，并在文本引导下完成和修改3D形状。

(CVPR2023)Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

Exp