贝叶斯环境中先验的“健忘”?


9

众所周知,随着您拥有更多的证据(例如,对于 nid个示例,以更大的的形式出现),贝叶斯先验被“遗忘”,并且大多数推论都受到证据(或可能性)的影响。nn

很容易在各种特定情况下看到它(例如带有Beta优先级的Bernoulli或其他类型的示例)-但是在和一些先前的?x1,,xnp(x|μ)p(μ)

编辑:我猜想它不能在一般情况下显示任何先验(例如,先有先有质量将使后验有先有质量)。但是也许在某些情况下会忘记先验。

这是我正在考虑显示的“路径”类型:

假设参数空间为,并且令和为两个先验值,它们在所有上放置非零概率质量。因此,每个先验的两次后验计算为:Θp(θ)q(θ)Θ

p(θ|x1,,xn)=ip(xi|θ)p(θ)θip(xi|θ)p(θ)dθ

q(θ|x1,,xn)=ip(xi|θ)q(θ)θip(xi|θ)q(θ)dθ

如果将除以(后验),则得到:pq

p(θ|x1,,xn)/q(θ|x1,,xn)=p(θ)θip(xi|θ)q(θ)dθq(θ)θip(xi|θ)p(θ)dθ

现在,当转到我想探讨以上术语。理想情况下,对于“有意义” 的某个或其他一些不错的行为,它将变为,但是我不知道如何在此处显示任何内容。n1θ


1
对于某些直觉,请注意,似然性随样本大小而定,而先验概率则不然。
2013年

@Macro,谢谢,我也有这种直觉,但我不能再进一步了。请参阅上面的修改。
bayesianOrFrequentist 2013年

Ghosh和Ramamoorthi的教科书《贝叶斯非参数》的前几章充实了您正在谈论的各种事情(首先是在参数设置中,然后是非参数设置);如果您在合适的机构中,可以通过Springer在线免费获得。有多种方式可以渐近地形式化对对先验的依赖的缺乏,但是当然有一些规律性条件。
家伙

请注意,后验比率仅与先验比率成正比,因此似然比和证据比率并没有真正影响此比率。
概率

Answers:


3

只是一个粗略但希望直观的答案。

  1. 从日志空间的角度来看它: 其中是一个常数,该常数取决于数据,而不取决于参数,并且您的可能性假定为iid观测值。因此,只需专注于确定后牙形状的部分,即

    logP(θ|x1,,xn)=logP(θ)i=1nlogP(xi|θ)Cn
    Cn>0
    Sn=logP(θ)i=1nlogP(xi|θ)
  2. 假定有一个,使得。这对于离散分布是合理的。D>0logP(θ)D

  3. 由于这些术语都是肯定的,因此 “将”会增长(我在这里跳过了技术性内容)。但是先验的贡献受限制。因此,由先验贡献的分数最高为,每增加一个观察值就会单调减小。SnDD/Sn

严格的证据当然必须面对技术问题(并且可能非常困难),但是上面的设置是恕我直言的最基本部分。


0

我对“先验被遗忘”和“大多数推论受到证据的影响”的说法感到困惑。我假设您的意思是,随着数据量的增加,估计器的(序列)将接近参数的真实值,而与我们之前的情况无关。

假设后验分布的形式存在一定的规律性条件,则贝叶斯估计量是一致的且渐近无偏的(见Gelman等,第4章)。这意味着随着样本数量的增加,贝叶斯估计器将逼近参数的真实值。 一致性意味着贝叶斯估计量在概率收敛于真实参数值,而渐近无偏则意味着,假设是参数的真实值,θ0

E[θ^|θ0]θ0Var(θ^)p0

收敛不取决于先验的具体形式,而仅取决于从先验获得的后验分布和似然性满足规则性条件。

Gelman等人提到的最重要的规律性条件是,似然性是参数的连续函数,而参数的真实值在参数空间内部。同样,正如您所指出的,在参数真值的真值的开放邻域中,后验必须为非零。通常,您的在整个参数空间上的优先级应该为非零。


谢谢,非常有见地。我实际上希望得到的结果甚至与“ true”参数值都不相关。只是从技术上证明,随着您拥有更多的证据,无论您开始使用哪种先验,都将获得相同的后验。我将进行一些编辑以反映这一点。
bayesianOrFrequentist

@bayesianOrFrequentist看一看所谓的贝叶斯中心极限定理
斯特凡·洛朗
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.