(要了解我为什么写这篇文章,请查看我对这个问题的回答下方的评论。)
III型错误和统计决策理论
为错误的问题提供正确的答案有时被称为III型错误。统计决策理论是不确定性下决策的形式化。它提供了一种概念框架,可以帮助避免III型错误。该框架的关键要素称为损失函数。它包含两个参数:第一个是世界的真实状态(的相关子集)(例如,在参数估计问题中,真实参数值);第二个是一组可能动作中的一个元素(例如,在参数估计问题中,估计θ)。输出对与世界上每种可能的真实状态有关的每种可能的动作所造成的损失进行建模。例如,在参数估计问题中,一些众所周知的损失函数是:
- 绝对误差损失
- 平方误差损失
- 哈尔瓦里安的LINEX损失
检查答案以找到问题
在某些情况下,可能会试图通过着重于制定正确的损失函数并继续进行其余的决策理论方法(此处未详述)来避免III型错误。这不是我的简要介绍–毕竟,统计学家已经掌握了许多行之有效的技术和方法,即使它们并非源自这种方法。但是,在我看来,最终结果是绝大多数统计学家都不了解也不在乎统计决策理论,而且我认为他们不在了。对于那些统计学家,我认为他们之所以会发现统计决策理论在避免III类错误方面很有价值,是因为它提供了一个框架,可以在其中询问任何建议的数据分析程序:该程序可以最佳地应对什么损失函数(如果有)?也就是说,在什么决策情况下,它到底能提供最佳答案?
后预期损失
从贝叶斯角度来看,损失函数就是我们所需要的。我们几乎可以忽略决策理论的休息-几乎可以肯定,做的最好的事情是尽量减少后预期损失,也就是找到动作最小化。
?(至于非贝叶斯观点嗯,这是频率论决策理论的定理-具体来说,沃尔德的完全类定理 -即最佳动作永远是尽量减少贝叶斯后验预期损失相对于一些(可能是不当)这个结果的困难在于它是一个存在定理,没有给出关于使用哪个先验的指导,但是它有效地限制了我们可以“反转”以弄清楚到底是哪个问题的过程的类别。特别是,反转任何非贝叶斯程序的第一步是弄清楚它复制或近似哪个贝叶斯程序(如果有)。
嘿,青色,您知道这是一个问答网站,对吗?
最后,这使我提出了一个统计问题。在贝叶斯统计中,当为单变量参数提供间隔估计时,两个常见的可信间隔过程是基于分位数的可信间隔和最高后验密度可信间隔。这些程序背后的损失函数是什么?