烧录后的MCMC迭代能否用于密度估计?


10

老化后,我们是否可以直接使用MCMC迭代进行密度估计,例如通过绘制直方图或核密度估计?我担心的是,尽管MCMC迭代最多是相同分布的,但它们不一定是独立的。

如果我们进一步将细化应用于MCMC迭代该怎么办?我担心的是,MCMC迭代最多是不相关的,并且尚未独立。

我通过Glivenko–Cantelli定理学习了将经验分布函数用作真实分布函数估计的基础,其中经验分布函数是基于iid样本计算的。我似乎看到了一些使用直方图或核密度估计作为密度估计的理由(渐近结果?),但我不记得他们了。

Answers:


8

您可以-有人可以-通过MCMC采样估算密度。

要记住的一件事是,尽管直方图和KDE很方便,但至少在简单情况下(例如Gibbs采样),可能会提供更有效的密度估计

如果特别考虑吉布斯采样,则可以使用您要从中采样的条件密度代替采样值本身来生成密度的平均估计值。结果趋于相当平滑。

该方法在

Gelfand和Smith(1990),“基于样本的方法计算边际密度”
,《美国统计协会杂志》,第1期。85,第410页,第398-409页

(尽管Geyer告诫说,如果采样器相关性足够高,那么它并不总是会减小方差并为此提供条件)

例如,在Robert,CP和Casella,G。(1999)Monte Carlo Statistics Methods中也讨论了这种 方法

您不需要独立性,实际上是在计算平均值。如果要计算密度估计值(或cdf)的标准误差,则必须考虑依赖性。

当然,同一概念也适用于其他期望,因此可以用来改进许多其他种类的平均值的估计。


谢谢!您的意思是说,因为边际分布是联合分布的期望,所以使用相关的MCMC迭代来估计边际分布没关系吗?如果使用相关的迭代来估计联合分布怎么办?还可以吗
2014年

不,那是我的意思。我的意思是,我们正在处理的估计量是事物的平均值,并且被用于估计可能反过来解释为这些事物的期望的人口数量。是的,您可以使用从属抽奖以相同的方式估计联合分布。
Glen_b-恢复莫妮卡2014年

为什么我们可以使用相关的迭代来估计联合分布?我认为不可以,因为联合分配并不是对某事的期望。请注意,在Glivenko–Cantelli定理中,经验cdf是根据iid样本计算得出的。
2014年

对于密度,您可以考虑使用类似于此处所述的样本估计值(并且可以将其视为具有越来越窄的条形图的直方图的极限);这是一个平均值,我相信它的期望是密度。关于CDF,您可能要考虑是否可以对经验CDF做一些事情以使其平均化。这两种想法似乎都适用于联合发行的样本。
Glen_b-恢复莫妮卡2014年

3

恢复

您可以将MCMC迭代直接用于任何事物,因为可观察对象的平均值将渐近逼近真实值(因为您处于老化状态)。

但是,请记住,此平均值的方差受样本之间的相关性影响。这意味着,如果将样本关联起来(如MCMC中常见的那样),则存储每次测量都不会带来任何真正的优势。

理论上,您应该在N步之后进行测量,其中N约为所测量的可观测物的自相关时间的数量级。

详细说明

让我们定义一些符号来正式回答您的问题。假设是您的MCMC仿真在时间,假定该时间远高于预烧时间。令为您要测量的可观测值。˚Fxttf

例如,,并且:“如果,否则为0”。自然是从分布绘制的,您可以使用MCMC 进行绘制。 ˚F = ˚F 一个X X [ 一个+ Δ ] X P X xtRf=fa(x)x[a,a+Δ]xtP(x)

在任何采样中,您将始终需要计算可观察到的的平均值,您可以使用估算器进行计算:f

F=1Ni=1Nf(xi)

我们看到该估计量(关于)的平均值为P X FP(x)

F=1Ni=1Nf(xi)=f(x)

这是您想要获得的。

主要问题是,当您计算此估计量的方差,您将获得以下形式的项F2F2

i=1Nj=1Nf(xi)f(xj)

如果是相关样本,则不会抵消。而且,因为您可以写,所以可以将上面的两倍和写为,的自相关函数的和。 Ĵ = + Δ ˚F - [R Δ xtj=i+ΔfR(Δ)

因此,回顾一下:

  • 如果在计算上不需要花费任何费用来存储每个度量,则可以执行此操作,但请记住,不能使用常规公式来计算方差。

  • 如果在MCMC的每个步骤上进行测量在计算上都很昂贵,则必须找到一种方法来估算自相关时间的累积,并仅每执行一次测量。在这种情况下,测量是独立的,因此可以使用方差的常用公式。τττ


这没有回答特定的问题,该问题涉及使用来自马尔可夫链的样本来构造后验的有效密度估计量。我们对线性函数的估计的标准误差高于基于独立性的朴素估计的标准这一点已广为人知,但基于这个答案,OP仍然不知道构造密度估计器是否是一个好主意使用(例如)内核平滑(即使在iid采样下也不会以速率收敛)。n
2014年

细化只是浪费有用的数据。它不会减少估计的方差。请参阅对此问题的评论:stats.stackexchange.com/a/258529/58675
DeltaIV '17年

@DeltaIV,是的。我的意思是,是否稀疏,相关的时间尺度仍然是自相关时间。
豪尔赫·雷涛
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.