在计算中使用概率密度函数。换句话说,如何评估这样的方程式。
我认为您仍然从常客的角度考虑这一问题:如果您要寻找一个点估计,则后验不会给您。您放入PDF,然后取出PDF。您可以通过从后验分布中计算统计数据来得出点估计,但我将稍作介绍。
我确实了解先验与后继的概念,并了解如何使用表格手动应用它们。我得到(我认为!)pi代表假定的人口比例或概率。
是同样的事情, p (X ):他们都是PDF文件。只是按常规方式使用 π来表示特定的PDF是先验密度。π(x)p(x)π
我怀疑您没有像您想象的那样获得先验和后验,因此让我们将其支持到贝叶斯统计的基本基础:主观概率。
主观概率的思想实验
假设我给您提供了一个硬币,然后问您您是否认为这枚硬币是公平的硬币。您已经听到很多人谈论概率等级中的不公平硬币,但是您实际上在现实生活中从未见过,因此您回答:“是的,当然,我认为这是一个公平的硬币。” 但是,事实上,我什至在问您这个问题,这会让您有些不安,因此,尽管您估计这是公平的,但如果不是这样,您就不会感到惊讶。与您在零钱中发现这枚硬币相比,您要感到惊讶的要少得多(因为您假设这是真实货币,并且由于我的行为可疑,因此您现在并不真正信任我)。
现在,我们进行一些实验。翻转100次后,硬币会退回53个目。您对它是一个公平的硬币更有信心,但是您仍然对它不是一个可能性持开放态度。所不同的是,如果事实证明该代币有某种偏见,您将感到非常惊讶。
在这里,我们如何表示您的先验信念和后继信念,特别是关于硬币出现正面的概率(我们将表示)?在常客的情况下,您先前的信念-您的零假设-是θ = 0.5。完成实验后,您将无法拒绝空值,因此继续假设是,硬币可能是公平的。但是,我们如何封装更改以使您确信硬币是公平的呢?在实验之后,您可以打赌硬币是公平的,但是在实验之前,您会感到恐惧。θθ = 0.5
在贝叶斯设置中,您通过不将概率视为标量值,而是视为随机变量(即函数)来封装对命题的信心。与其说,我们说θ 〜ñ (0.5 ,σ 2),从而封装我们在PDF的方差信心。如果我们设置一个高方差,那是说:“我认为概率为0.5,但是如果我实际观察到的概率与该值相距甚远,我也不会感到惊讶。我认为θ = 0.5θ = 0.5θ 〜Ñ(0.5 ,σ2)θ = 0.5,但坦率地说我不确定。”通过设置较低的方差,我们说:“我不仅相信概率为0.5,而且如果实验提供的值与。“因此,在本示例中,当您开始实验时,您具有较高的先验方差。在收到证实您的先验的数据后,先验的均值保持不变,但方差变得更窄。进行实验后,θ = 0.5比以前高得多。θ = 0.5θ = 0.5
那么我们如何执行计算呢?
我们以PDF开头,然后以PDF结尾。当您需要报告点估计时,您可以计算统计量,例如后验分布的均值,中位数或众数(取决于损失函数,我现在不介绍它。让我们坚持均值)。如果您有PDF的封闭式解决方案,则确定这些值可能很简单。如果后验复杂,则可以使用MCMC之类的程序从后验中取样并从绘制的样本中得出统计信息。
在具有Beta先验和二项式似然的示例中,后验的计算简化为非常干净的计算。鉴于:
- 前值:θ∼Beta(α,β)
- X|θ∼Binomial(θ)
然后后验简化为:
- θ|X∼Beta(α+∑ni=1xi,β+n−∑ni=1xi)
只要您具有beta先验和二项式可能性,就会发生这种情况,其原因应该在DJE提供的计算中显而易见。当特定的先验似然模型始终给出与先验具有相同分布类型的后验时,用于先验的分布类型和似然性之间的关系称为共轭。有许多具有共轭关系的分布对,贝叶斯算法经常使用共轭来简化计算。给定特殊的可能性,您可以通过选择共轭先验条件(如果存在并且可以证明对先验条件的合理性)来简化生活。
我相信beta(1,1)指的是平均值为1且stdev为1的PDF?
在正态分布的通用参数化中,两个参数分别表示分布的平均值和标准偏差。但这就是我们对正态分布进行参数化的方式。其他概率分布的参数差异很大。
Beta(α,β)αβ
XE[X]var[X]∼Beta(α,β)=αα+β=αβ(α+β)2(α+β+1)
您可以清楚地看到,均值和方差不是此分布的参数化的一部分,但是它们具有封闭式解决方案,它们是输入参数的简单函数。
Beta(1,1)Uniform(0,1)