关于郎之万动力学采样与EBMs模型
date
Sep 5, 2022
Last edited time
Sep 5, 2022 05:03 PM
status
Published
slug
关于郎之万动力学采样与EMB模型
tags
Algorithm
summary
type
Post
Field
Plat
布朗运动
朗之万方程描述的是布朗运动,即由于与流体分子的碰撞,粒子的随机运动方程为:
其中 是粒子的位置, 是粒子的质量。右边式子的第一项是流体的粘滞力,第二项就是分子热运动带来的碰撞力,也叫做热涨落。它有个特点就是时间上平均值等于0。通过解方程(1),我们可以得到:
其中, ,和温度成正比。
这个解的意思是,布朗运动粒子平均运动位置离原点(初始点)距离的平方和时间成正比。这个解就是对扩散运动的一个直观解释,随着时间推移,粒子跑的越来越“散”。
也被叫做爱因斯坦关系,由阿尔伯特·爱因斯坦在1905年和Marian Smoluchowski在1906年独立发现。
重现玻尔兹曼分布
我们知道抽样方法的目标就是抽样一个分布,那么布朗运动和分布又有什么关系呢?
假设粒子在一个势能 中运动,它的运动方程由郎之万动力学描述:
按照(1)式相同的解法,我们会得到关于粒子位置 分布的解:
这个方程就是我们常见的玻尔兹曼分布。通过郎之万方程,我们竟然获得了粒子的分布。
郎之万动力学采样法
我们从布朗运动出发,通过郎之万动力学,架起来动力学和分布的桥梁。接下来就可以利用这个桥梁来采样了:
通过模拟动力学来采样分布,具体而言就是精确模拟粒子在势能以及热涨落中运动,捕捉粒子的位置,作为样本,就会得到想要的分布。
最后要给大家交代的就是“势能”以及“热涨落”怎么来模拟:
热涨落力具有高斯分布,于是我们可以用高斯分布来模拟这个力:
对于贝叶斯分布后验分布, ,其中 是参数。根据玻尔兹曼分布,其势能就是 。于是势能力就可以通过对势能求梯度而获得。
于是当势能和热涨落都可以模拟的情况下,我们就可以通过模拟粒子运动来采样了:
这个公式来自于Bayesian Learning via Stochastic Gradient Langevin Dynamics,具体细节大家可以参考这篇文章。
最后要补充的就是,如果去掉高斯项 ,剩下的部分就是梯度项,不就是我们常见的梯度法(gradient method)来优化目标函数吗?从这个角度而言,在梯度项上面加一个平凡无奇的高斯项就可以化优化为采样,实在是太神奇了!