如果我们已经知道后验分布,为什么需要从后验分布中采样?


19

我的理解是,当使用贝叶斯方法估算参数值时:

  • 后验分布是先验分布和似然分布的组合。
  • 我们通过从后验分​​布生成样本来模拟此过程(例如,使用Metropolis-Hasting算法生成值,如果它们超过属于后验分布的概率的某个阈值,则接受它们)。
  • 生成此样本后,我们将使用它来近似后验分布以及诸如均值之类的东西。

但是,我觉得我一定是误会了。听起来我们有一个后验分布,然后从中进行采样,然后使用该样本作为后验分布的近似值。但是,如果我们有后验分布开始,为什么我们需要从中进行采样来近似呢?

Answers:


20

这个问题可能已经在这个论坛上考虑过了。

当您声明“具有后验分布”时,您的意思是什么?“具有”的函数,我知道是成正比的后部,即π θ | X α π θ × ˚F X | θ 例如完全人工目标π θ | X α EXP { - | | θ - X | | 2| | θ + xθ

π(θ|x)π(θ)×f(X|θ
并没有告诉我是什么
πθ|X经验值{-||θ-X||2-||θ+X||4-||θ-2X||6}  Xθ[R18岁
  1. 函数的后验期望,例如E [ hθ | x ],后验均值,在标准损失下充当贝叶斯估计器;θË[Hθ|X]
  2. 在任意效用函数下的最佳决策,该决策将预期的后路损失降至最低;
  3. {h=h(θ); πh(h)h_}
  4. 最可能的模型是在将参数的某些部分设置为特定值与保持未知(随机)之间进行选择。

这些仅是后验分布的许多用法的示例。在除了最简单的情况以外的所有情况下,我都无法通过盯着后验分布密度来提供答案,并且确实需要进行数值解析,例如蒙特卡洛和马尔可夫链蒙特卡洛方法。


非常感谢您对西安的回答。我敢肯定,这回答了我的问题,但是我仍然很难理解它。我有一个与后验相对应的概率密度函数(即通过组合先验概率和似然函数)吗?为什么我们不能直接从此而不是从采样的后验分布中找到95%CI?
戴夫

2
@戴夫我认为这里的关键是您所说的“拥有”的意思。通常,您没有封闭式解决方案,因此您不会在有用的意义上“拥有”该功能。
和尚

@monk感谢您的回复!您介意构成非封闭式解决方案的原因是什么?
戴夫

2
假设您的先验值为Beta(a,b),而您的可能性为二项式(n,p)。您如何计算后验的期望值?尝试用笔和纸计算出该产品的积分。通常,这种积分将需要计算机为其获取精确值。或者,您可能发现Beta在二项式之前是共轭的,因此后验将是Beta(具有容易计算的参数)。但是通常您不会很幸运。确定“封闭形式”的定义很困难,值得一读。
和尚

4

是的,您可能具有分析后验分布。但是贝叶斯分析的核心是边缘化参数的后验分布,以便在准确性和泛化能力方面都能获得更好的预测结果。基本上,您希望获得具有以下形式的预测分布。

p(x|D)=p(x|w)p(w|D)dw

p(w|D)p(w|D)p(x|w)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.