我正在阅读有关贝叶斯推论的文章,碰到过这样的短语:“边际可能性的数值积分太昂贵了”
我没有数学背景,我想知道昂贵在这里到底意味着什么?它只是在计算能力方面还是还有其他功能。
我正在阅读有关贝叶斯推论的文章,碰到过这样的短语:“边际可能性的数值积分太昂贵了”
我没有数学背景,我想知道昂贵在这里到底意味着什么?它只是在计算能力方面还是还有其他功能。
Answers:
在计算问题(包括贝叶斯推断的数值方法)的情况下,短语“太贵”通常可以指两个问题
无论哪种情况,构成“预算” 的计算资源都可能由CPU周期(时间复杂度),内存(空间复杂度)或通信带宽(在计算节点之内或之间)组成。在第二种情况下,“太贵”将意味着棘手。
在贝叶斯计算的背景下,行情是可能指的问题与边缘化了一个很大的变数。
例如,最近这篇论文的摘要开始
集成受维数诅咒的影响,随着问题维数的增长,集成很快变得棘手。
然后继续说
我们提出一种随机算法,该算法又可以用于例如边际计算或模型选择。
(作为比较,这本书的最新一章讨论了被认为“不太昂贵”的方法。)
我将为您提供一个离散案例的例子,以说明为什么积分/求和非常昂贵。
假设我们有二进制随机变量,并且我们具有联合分布。(实际上,不可能将联合分布存储在表中,因为有值。让我们假设现在在表和RAM中都有它。)P (X 1,X 2,⋯ ,X 100)2 100
为了在上获得边际分布,我们需要对其他随机变量求和。(在连续的情况下,将其整合。)
我们正在对变量进行求和,因此,存在幂运算,在这种情况下为,这是地球上所有计算机都无法执行的巨大数字。2 99
在概率图形模型文献中,这种计算边际分布的方式称为“蛮力”方法来执行“推断”。顾名思义,我们可能知道它很昂贵。人们使用许多其他方式来执行推断,例如,有效地获得边际分布。“其他方式”,包括近似推断等。
通常,在执行贝叶斯推断时,很容易遇到麻烦的变量,例如严重的整合。另一个示例可以是在这种情况下从似然函数进行的数值采样,这意味着从给定分布执行随机采样。随着模型参数数量的增加,这种采样变得非常繁重,并且已经开发出各种计算方法来加快过程并允许非常快速的实现,当然还要保持较高的准确性。这些技术例如是MC,MCMC,Metropolis ecc。看看Gelman等人的贝叶斯数据分析。还应该给您一个广泛的介绍!祝好运