Answers:
通过浏览您共享的幻灯片,在我看来,这个主意是要解释如何使用MAP估计来估计后验的不同属性,例如均值,众数和中位数。我将尝试在斯蒂芬·M·凯(Stephen M.Kay)的书《统计信号处理基础》中介绍的通用贝叶斯估计器的背景下对此进行解释。
让我们从考虑与估计参数相关的三种风险(即成本函数)开始:
- ; 否则
其中,,其中θ是所述估计值和θ是真实参数。在贝叶斯估计中,目标是最大程度地降低预期风险,即:
因为我们只关心,我们将集中于内积分。
现在,根据我们选择的,估计器将为我们提供后验的不同属性。例如,如果我们选择第一种情况下,,则最小化为,是平均。因为你的问题是关于指示器功能,我将解决上面提到的第三种风险(如果您考虑,等同于使用指标)。
对于上述情况3:
这对于时为最小θ对应于后的模式。
在具体情况下的参数空间是有限的或可数无限Θ = { θ 1,θ 2,... }与指示器相关联的损失后损耗等于被错误的概率P(θ ≠ θ | X )和当的是正确的后验概率它最小化P(θ = θ | X )被最大化。这意味着,θ是后验分布或MAP的模式。
然而,MAP的这种关系,并的损失是“无名氏定理”,它是在最不正确的设置,也就是说,它并不适用于连续参数空间,其中P(θ = θ | X )= 0所有θ的,并与结果进一步的冲突Druihlet和马林(BA,2007年),谁指出,MAP最终取决于主导措施的选择。(即使Lebesgue度量被隐式选择为默认值。)
例如,Evans和Jang 在2011年发表了一份arXiv论文,讨论了MAP,最小相对意外(或最大轮廓似然)估计量和损失函数之间的联系。问题的核心是,至少在连续参数空间中,无论是MAP估计器还是MLE都没有真正通过决策理论方法证明其合理性。正如Druihlet和Marin在2007年所证明的那样,在参数空间上任意选择的支配度量会影响MAP的值。它们以损失函数 ,其中他们考虑通过d来估计变换Ψ(θ),并由该变换的边际先验反加权。在身份变换的特殊情况下,此损失函数导致MLE作为贝叶斯估计器。在一般情况下,贝叶斯估计器是最大轮廓似然估计器(LRSE)。但是,这种损失函数不能推广到无数(显然是连续的)参数空间,在这种情况下,作者只能提供LRSE作为贝叶斯程序的极限。在可数情况下采用的损失函数例如是 L(θ ,d )= I { Ψ (
Robert Bassett和Julio Deride 在2016年发表了一篇论文,讨论了MAP在贝叶斯决策理论中的位置。
“……我们为MAP估计量的普遍接受概念提供了一个反例,它是损失为0-1的Bayes估计量的极限。”
作者提到了我的《贝叶斯选择》一书,其中指出了该属性,而没有采取进一步的预防措施,我完全同意在这方面大意!困难在于最大化者的极限不一定是极限的最大化者。本文包括一个具有上述效果的示例,该示例具有先验条件,与不依赖参数的采样分布相关联。其中提出的充分条件是后部密度几乎肯定是适当的或准凹的。