ABC和MCMC在应用方面有何不同?


15

据我了解,近似贝叶斯计算(ABC)和马尔可夫链蒙特卡洛(MCMC)具有非常相似的目标。下面,我将描述我对这些方法的理解,以及如何理解它们在实际数据中的应用差异。

近似贝叶斯计算

ABC包括先验取样一个参数θ,然后通过数值模拟计算出统计量xi,并将其与一些观测到的xobs。基于拒绝算法,xi被保留或拒绝。保留列表xi所做出的后验分布。

马尔可夫链蒙特卡洛

MCMC包括对参数的先验分布进行采样。它需要一个第一样本θ 1,计算P X ö b 小号 | θ 1P θ 1,然后跳转(根据某些规则)到一个新的值θ 2为其中P X ö b 小号 | θ 2P θ 2被再次计算。比率P x o b sθθ1P(xobs|θ1)P(θ1)θ2P(xobs|θ2)P(θ2)进行计算,并根据一些阈值时,将来自所述第一或第二位置发生的下一个跳跃。探索θ值的过程是一而终,最后,保留的θ值的分布是后验分布Pθ|x(出于我尚不知道的原因)。P(xobs|θ2)P(θ2)P(xobs|θ1)P(θ1)θθP(θ|x)

我意识到我的解释未能代表这些术语(尤其是MCMC)下每个术语下存在的各种方法。

ABC vs MCMC(利弊)

ABC的优点是不需要解析地求解。这样,ABC对于MCMC无法做到的复杂模型很方便。P(x|θ)P(θ)

MCMC允许进行统计检验(似然比检验,G检验……),而我认为这对于ABC来说是不可行的。

我到目前为止正确吗?

  • ABC和MCMC在应用方面有何不同?如何决定使用一种或另一种方法?

1
“ MCMC包含对参数θ的先验分布进行采样。” 虽然当然可以做到这一点,但在大多数情况下这不是必需的,甚至也不是理想的。对于许多MCMC应用,我们从以θ1为中心的候选分布中采样θ2(例如,具有小标准偏差的高斯),然后如上所述计算接收/拒绝比。这与ABC相反,在ABC中,我们从先验样本中采样(这通常是将先验信息合并到ABC中的唯一方法)。
z_dood '16

Answers:


12

在比约恩的答案之上还有一些其他评论:

  1. Rubin(1984)首次提出ABC是为了解释贝叶斯推理的性质,而不是出于计算目的。在本文中,他解释了采样分布和先验分布如何相互作用以产生后验分布。

  2. 然而,主要出于计算原因而利用ABC。人口遗传学家在基于树的模型上提出了该方法,在这种模型中,观察到的样本的可能性难以捉摸。在这种情况下可用的MCMC(数据增强)方案效率非常低下,即使使用一个单一参数,重要性抽样也是如此。并非所有实际目的都可用。当它们可用时,ABC会作为代理显示,如果运行速度更快,可用于对其进行校准。

  3. 从更现代的角度来看,我个人认为ABC是一种近似推理方法,而不是一种计算技术。通过建立一个近似模型,人们可以推断出感兴趣的参数,而不必依赖精确的模型。虽然在此设置中需要某种程度的验证,但它的有效性不比进行模型平均或非参数有效。实际上,ABC可以看作是非参数贝叶斯统计的一种特殊类型。

  4. 还可以证明,(嘈杂的)ABC是一种完美定义明确的贝叶斯方法,如果人们用嘈杂的ABC代替了原始模型和数据。因此,它允许人们想到的所有贝叶斯推论。包括测试。我们对有关ABC和假设检验的争论的输入是,在给定数据的情况下,基于ABC的近似模型可能最终无法很好地评估假设的相关性,但这并不是必需的,因为大多数ABC在人群中的应用也是如此遗传学与模型选择有关。

  5. 从更近的角度来看,我们可以将ABC看作是间接推理的贝叶斯版本,其中统计模型的参数与预定统计的时刻相关。如果此统计信息足以(或就白话意义而言)足以识别这些参数,则可以证明 ABC已收敛到具有观察次数的参数的真实值。


2
我检查了这个答案,但建议您先阅读@Björn的答案(+1),然后再阅读西安的答案。
Remi.b

12

区别在于,使用ABC时,您不需要的解析表达式,而是通过模拟数据并查看θ的值来近似它P(x|θ)θ模拟数据最经常(近似)匹配观察到的数据(具有建议值,例如从先前随机抽取)。对于简单的情况,例如单个二项式随机变量的样本量不太大,您甚至可能需要完全匹配,在这些情况下,对于这些后验样本,您确实无法做任何事,而对于标准MCMC样品。对于具有连续性(甚至对于多元离散结果)以及可能需要多元匹配的潜在多元结果的更为复杂的情况,不再可行。

实际上,存在ABC的MCMC版本,该问题解决了以下问题:如果您的先验与后验不十分相似(例如,因为先验是非常缺乏信息性的),则从先验中抽取是极其无效的,因为您很少会在观察到的数据和模拟数据之间获得紧密匹配。

P(x|θ)P(x|θ)P(x|θ在分析上不可用。当然,在这种情况下,可能还有一些其他可能的选择(例如INLA,似然的二次近似等),对于某些特定问题可能更为有效/成功。在某种程度上,对ABC的后验样本所做的任何限制都仅来自实际数据和模拟数据之间的近似匹配(如果您需要精确匹配,则完全没有问题)。有几篇很好的介绍性论文,例如Marin等人的论文。(2012)。至少有一位共同作者(@Xian)在这里是活跃的撰稿人,我也很想在这里发表他的想法-我相信他也许可以在测试主题上说很多话。


我希望我现在能够修复该链接(现在对我有用)。
比约恩

1
(+1)分!
西安

1
“当解析出P(x |θ)时,我认为使用标准MCMC几乎总是更可取。” 几乎,但并非总是如此。想象一下,其中有一个非常大的样本量(10 ^ 9),并结合了许多参数。重新计算每组参数的可能性变得非常昂贵。使用ABC,可以使用许多技巧来加快速度。使用MCMC,就不那么多了。
z_dood '16

2
@z_dood:当有太多观测值无法真正计算似然性时,例如,当它们需要存储在不同的计算机上时,似然函数在分析上不可用是有争议的。
西安
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.