Answers:
(阅读先前的答案有点令人惊讶,前者的答案集中在后验正确时潜在的不当行为,因为据我所知,问题是后验是否必须正确(即,可整合为一个),以成为适当的后验(即贝叶斯推断可接受)。)
在贝叶斯统计,后验分布具有是一个概率分布,从中可以推导出像后平均的时刻和概率陈述,例如可信区域的覆盖范围。如果将后验 π (θ | x )归一化为概率密度,并且不能简单地进行贝叶斯推断。在这种情况下,后部根本不存在。
实际上,(1)必须对样本空间中的所有都适用,而不仅要对所观察的x都适用,否则,选择先验将取决于数据。这意味着不能使用像Haldane的先验π (p )∝ { 1 / p (1 - p )}那样的先验,因为二项式或负二项式变量X的概率为p,因为未为x =定义后验0。
我知道有一个例外,可以考虑“不适当的后人”:David van Dyk和孟小立在“数据增强的艺术”中可以找到它。不适当的措施是在所谓的工作参数 ,使得观测由边缘的增强分布的产生 ˚F (X | θ )= ∫ Ť (X 八月)= X ˚F (X 八月| θ ,α ) 和van Dyk和Meng在此工作参数 α上放置了不适当的先验 p (α ),以加快MCMC对 π (θ | x )的模拟(仍然明确定义为概率密度)。
从另一个角度来看,与eretmochelys的回答有些相关,即贝叶斯决策理论的观点,如果(1)发生的设置能够导致最佳决策,那么仍然可以接受。即,如果是一个损失函数评估使用决定的影响δ,一个贝叶斯最优决策现有下π由下式给出 δ ⋆(X )= ARG 分钟δ∫大号(δ ,θ )˚F和所有重要的是,这个积分是不是到处(以 δ)无限。是否(1)成立是继发的推导 δ ⋆(X ),即使像受理属性时(1)成立仅保证。
。由于连续变量的古怪性质,因此出现了此问题。
换句话说:使后验不当的那些样本值的先验预测概率等于零。
这个故事的寓意:提防空集,它们可能会咬人,无论多么不可能。
PS正如罗伯特教授在评论中指出的那样,如果先验不当,这种推理就会失败。
任何“分布”都必须求和(或积分)为1。我可以想到一些示例,其中的一个可能适用于非标准化分布,但是我曾经不满意将任何边缘化为1的东西称为“分布”。
考虑到您提到贝叶斯后验,我敢打赌,您的问题可能来自的的最优估计的分类问题
where the last equality comes from the fact that doesn't depend on . We can then choose our exclusively based on the value which is proportional to our Bayesian posterior, but do not confuse it for a probability!
Improper posterior distribution only arises when you're having an improper prior distribution. The implication of this is that the asymptotic results do not hold. As an example, consider a binomial data consisting of success and 0 failures, if using as the prior distribution, then the posterior will be improper. In this situation, the best is to think of a proper prior distribution to substitute your improper prior.