MCMC方法-燃烧样品?


12

MCMC方法中,我一直在阅读有关burn-in时间或的样本数的信息"burn"。这到底是什么?为什么需要它?

更新:

一旦MCMC稳定下来,它会保持稳定吗?burn-in时间的概念与混合时间的概念有何关系?


1
老化 ”一词并不意味着“燃烧”样品,而是让系统令人满意地从“新”状态沉降到适合使用的状态。(样品在的,是沉淀过程中丢弃,但是这句话并不意味着在这个意义上“燃烧”,它是更接近采取它的道路上之前“发动机升温”。)见这个答案对于一些讨论是为了什么
Glen_b-恢复莫妮卡2014年

(具体来说,该答案的第一段)
Glen_b-恢复莫妮卡2014年

1
@Glen_b,我想我知道,但我喜欢在烟雾更好地往上走的可疑样品的精神形象....
马特·克劳斯

Answers:


17

老化的目的是给予马尔可夫链时间达到平衡分布的时间,尤其是当它从糟糕的起点开始时。要“老化”一条链,只需在开始收集点之前丢弃前样本。n

这个想法是,一个“不好的”起点可能会使均衡分布下的区域实际上采样概率非常低,然后才进入平衡分布。如果将这些点丢掉,那么应该不太可能出现的点将非常少见。

该页面提供了一个很好的示例,但同时也指出,烙印更像是一种技巧/艺术形式,而不是有原则的技术。从理论上讲,您可以采样很长时间,或者找到某种方法来选择一个不错的起点。

编辑:混合时间是指链条达到稳态所需的时间,但是通常很难直接计算。如果您知道混合时间,您将丢弃那么多样本,但在许多情况下,您不会。因此,您选择的预烧时间应该足够大。

至于稳定性-这取决于。如果您的连锁店已经收敛,那么...就收敛了。但是,在某些情况下,链似乎已经收敛,但实际上只是在状态空间的一部分中“闲逛”。例如,假设有几种模式,但是每种模式之间的连接都很差。采样器可能需要很长的时间才能跨越该间隙,并且看起来链条已经收敛,直到发生跳跃为止。

有一些收敛性诊断程序,但其中许多很难区分真正的收敛性和伪收敛性。马尔可夫链手册《蒙特卡洛》中的查尔斯·盖尔(Charles Geyer)的一章(#1)对所有事情都非常悲观,但要尽可能长时间地运转链条。


谢谢。我为OP添加了一个小更新,希望进一步阐明这个概念。
Amelio Vazquez-Reina 2014年

我加了一点;希望能有所帮助。
Matt Krause 2014年

6

Metropolis-Hastings算法从后验分布中随机采样。通常,初始样本不是完全有效的,因为马尔可夫链尚未稳定到平稳分布。样品中的灼伤使您可以丢弃尚未固定的这些初始样品。


1
谢谢-一旦马尔可夫链稳定下来,它会保持稳定吗?这与混合时间的概念有何关系?一样吗
Amelio Vazquez-Reina 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.