(Song)Consistency Model 论文阅读

date

May 8, 2023

Last edited time

May 29, 2023 08:13 AM

status

Published

slug

(Song)Consistency-Model论文阅读

tags

summary

2023.05.23@更加细致的读了一下 2023.05.26@修改了一处公式错误

type

Post

origin

https://www.notion.so/lazurite/Song-Consistency-Model-6836a83e3ac849da95e19d9f0c1c46f9?pvs=4

Field

Plat

Consistency Models

Diffusion models have made significant breakthroughs in image, audio, and video generation, but they depend on an iterative generation process that causes slow sampling speed and caps their...

https://arxiv.org/abs/2303.01469

Song et al. - 2023 - Consistency Models.pdf

47292.4KB

GitHub - openai/consistency_models: Official repo for consistency models.

Official repo for consistency models. Contribute to openai/consistency_models development by creating an account on GitHub.

https://github.com/openai/consistency_models

一步生成的扩散模型：Consistency Models

今天在推特上看到了 consistency models 代码的开源这篇工作的论文在今年3月放出，那时候还没有开源代码，但是其展现的潜力让人印象深刻。因为 Diffusion Models 在生成一张图片时需要多次进行模型推理，对于实时…

https://zhuanlan.zhihu.com/p/621673283

💡

基于 Song 的 EDM

主要思想是训练轨迹上的每一个点够做得到相同的预测

Score-based Models

Derivation of formulas in Score-Based Models

https://lazurite.vercel.app/Derivation-of-formulas-in-Score-Based-Models

ODE 描述的反向过程为

我们设置 , where denotes the convolution operation.

💡

就是

Consistency Models

Parameterization

回顾一下 diffusion 的采样过程，从先验分布出发，推导采样过程:

Consistency Models 假设存在一个函数，对于上述过程中的每个点，都能输出一个相同的值

即

并且对于轨迹的起点，我们有。我们称这种约束为边界条件。一个有效的一致性模型必须尊重这个边界条件。

我们通过如下设计

💡

where and are differentiable functions such that , and .

假如有了，那么生成过程，就是采样一个，然后一步到位：.

Sampling

单步采样

那么对于轨迹中任意一点，我们代入先验分布, 即可得到。

💡

这个就是相当于直接预测了

多步采样

还可以通过交替去噪和噪声注入步骤多次评估一致性模型，以提高样本质量。

Train Consistency Model

Consistency Distillation

如果已经有了score function ，那么这个PF ODE就已经显式地确定下来了，consistency function要拟合的目标就很明确。

💡

为使用 ODE 求解器进行求解得到的 .

由于ODE是确定的，我们当然可以直接采样，然后用PF ODE数值求解出，直接优化。但是这样每对样本都要求解一遍ODE，效率很低。一种最简单的办法其实是直接监督一条轨迹上相邻两个点的模型输出一致. 在这种训练模式下假定的是已经获得score model，即 ODE中的solver通用解可以是：

其中表示solver的更新方式, 得到一个处于该 ODE 轨迹上的样本对: .

💡

在Euler solver中，这个项可以写成：

我们在这项工作中只考虑一步 ODE 求解器.

从一致性的角度来说，最终期望的结果应当是：

因此, 直接优化ODE轨迹上的两个点的一致性函数预测的距离.

💡

如何满足边缘条件 ?

文章在附录 A.2 中给出了证明:

Consistency Training

没有预训练模型就意味着不存在score model , 因此需要重新定义：

💡

定义 , 可以得到:

如果假定score model是存在的，那么这个无预训练的模型（CT）和蒸馏的模型（CD）应当是存在一定联系的，比如说实际上他们相差的就是score model，即我们认为的ground truth，所以会存在一点点误差。loss之间的关系可以写成：

进一步在没有的情况下得出无预训练的consistency model的loss：

其中 .

Code

Experiment

PS: diffusion > CD > diffusion distillation > CT