贝叶斯定理变为
一切都很好。但是,我在某处读过:
基本上,P(data)只是归一化常数,即使后验密度积分为一个常数的常数。
我们知道和。 0 ≤ P (数据| 模型)≤ 1
因此,必须介于0和1之间。在这种情况下,为什么我们需要归一化常数以使后验积分到一个?
贝叶斯定理变为
一切都很好。但是,我在某处读过:
基本上,P(data)只是归一化常数,即使后验密度积分为一个常数的常数。
我们知道和。 0 ≤ P (数据| 模型)≤ 1
因此,必须介于0和1之间。在这种情况下,为什么我们需要归一化常数以使后验积分到一个?
Answers:
首先,“似然x先验”的积分不一定是1。
如果不是,则不正确:
和 0 ≤ P (数据| 模型)≤ 1
那么该产品相对于模型的积分(实际上是模型的参数)为1。
示范。想象两个离散密度:
如果您乘他们两个你: ,因为它没有集成到一个它是不是有效密度: 0.40 + 0.25 = 0.65
(很抱歉,这种可怜的表示法。我为同一件事写了三种不同的表达方式,因为您可能会在文献中看到它们)
其次,“似然性”可以是任何值,即使它是密度,也可以具有大于1的值。
正如@whuber所说,此因子不必介于0和1之间。它们需要其积分(或总和)为1。
第三,“共轭”是您的朋友,可以帮助您找到标准化常数。
您已经有两个有效的答案,但让我加两分。
贝叶斯定理通常定义为:
因为您需要常数的唯一原因是使它积分为1(请参见其他人的答案)。大多数贝叶斯分析的MCMC仿真方法都不需要这样做,因此从方程式中减去了常数。因此,对于大多数模拟,甚至都不需要。
我喜欢Kruschke的描述:最后一只小狗(常数)很困,因为他与配方无关。
也有一些人,例如安德鲁·盖尔曼(Andrew Gelman),将常量视为“被高估了”,并且“当人们使用固定优先级时基本上毫无意义”(请查看此处的讨论)。
0 <= P(model) <= 1
或0 <= P(data/model) <= 1
,因为其中一个(甚至两个!)都可能超过(甚至是无限大)。参见stats.stackexchange.com/questions/4220。