Adversarial Diffusion Distillation 论文阅读
date
Nov 29, 2023
Last edited time
Nov 29, 2023 01:54 PM
status
Published
slug
Adversarial Diffusion Distillation 论文阅读
tags
DDPM
summary
type
Post
Field
Plat
我们的方法在概念上很简单:我们提出了对抗扩散蒸馏(ADD)的通用方法,将预训练扩散模型的推理步骤减少到1-4个采样步骤,同时保持高采样保真度,并潜在地进一步改善模型的整体性能。为此,我们引入了两种训练目标的组合:(i)对抗损失和(ii)对应于评分蒸馏采样(SDS)的蒸馏损失。对抗损失强制模型在每次前向传递时直接生成位于真实图像流形上的样本,避免了在其他蒸馏方法[43]中通常观察到的模糊和其他伪像。蒸馏损失使用另一个预训练的(且固定的)DM作为教师,有效利用预训练DM的广泛知识,并保留大型DM中观察到的强组合性。
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2F6f37a924-0137-4f07-bf37-f46627eff8f9%2FUntitled.png?table=block&id=7914fd3e-e660-451d-aec2-51fdda004ba3&cache=v2)
我们的训练过程如图2所示,涉及三个网络:ADD-student是从预训练的UNet-DM初始化的,其权重为 ,鉴别器具有可训练的权重 ,而 DM teacher则具有冻结的权重 。在训练过程中,ADD-student从噪声数据 生成样本 。噪声数据点是通过前向扩散过程 从真实图像数据集 产生的。在我们的实验中,我们使用与学生DM相同的系数 和 ,并从选定的学生时间步长集 中均匀地采样 。在实践中,我们选择 。
对于对抗目标,生成的样本 和真实图像 被传递给鉴别器,鉴别器旨在区分它们。为了从DM teacher中提取知识,我们将学生样本 通过教师的前向过程进行扩散得到 ,并使用教师的去噪预测 作为蒸馏损失 的重建目标。因此,总体目标为:
Exp
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2F4869ca9b-7678-499a-b771-4ffffce12846%2FUntitled.png?table=block&id=fc7a6c13-b721-4823-9463-49adef56d59a&cache=v2)
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2F0df91d81-efd3-4535-9525-81d9e68c8a92%2FUntitled.png?table=block&id=1de67153-9050-4b87-bf34-d969298d40dc&cache=v2)
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2F90cce212-c0ee-4490-a514-4b1406d655e2%2FUntitled.png?table=block&id=edfda6ef-8137-4566-a559-9bfd2950b6cf&cache=v2)
这个 Loss term 的消融很奇怪,只要 就有很好的效果。并且不用蒸馏扩散模型。
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2F0c410b47-872f-4c9b-a2a0-4ad718d00ae6%2FUntitled.png?table=block&id=3897bc52-7656-4e0b-85c1-e80f4fa8d078&cache=v2)