马尔可夫蒙特卡洛方法

前两篇文我们分别理解了马尔可夫链和蒙特卡洛方法是做什么的,那么这两个加起来就构成了我们的主菜-马尔可夫蒙特卡洛方法。它是一个抽样方法,用于对一个概率分布进行随机抽样,或者可以求出关于该概率分布的数学期望。因为概率分布P(X)可能比较复杂不方便对其进行抽样,如果直接用蒙特卡洛方法我们需要定义一个建议分布才能对其进行抽样,比如我们之前举例中的π的计算,我们需要定义一个正方形来覆盖圆,才能用蒙特卡洛方法来近似π值。但是马尔可夫链蒙特卡洛法避免了建议分布的定义(通常也很难,因为P(X)如果本身很复杂那么建议分布的定义必然也很困难),而是去构造一个平稳分布是P(X)的马尔可夫链,以X在马尔可夫链上随机游走而获得满足P(X)的一份抽样,同样当马尔可夫链的抽样趋于平稳时就可以计算函数关于P(X)的数学期望了!是不是很巧妙啊,其实就是将一个复杂的问题转换为另外一个简单一些的问题,也是算法设计中变治思想的体现。

如何设计马尔可夫链使其满足平稳分布为P(X)呢,有两种方法,一种称之为Metropolis-Hasting算法,一种称为吉布斯抽样两种算法。后续会分别详细介绍,这里大家只要明白马尔可夫蒙特卡洛方法的核心思想就好了。

那么马尔可夫蒙特卡洛方法和统计学习有什么联系么?因为这个方法可以求函数关于分布的积分,在统计学习中条件概率分布用贝叶斯公式+全概率公式形式正表示成了包含积分的形式,所以可以借助用马-蒙方法求条件概率P(X|Y)。


马尔可夫蒙特卡洛方法


分享到:


相關文章: