贝叶斯可信区间过程的决策理论依据是什么?


20

(要了解我为什么写这篇文章,请查看我对这个问题的回答下方的评论。)

III型错误和统计决策理论

为错误的问题提供正确的答案有时被称为III型错误。统计决策理论是不确定性下决策的形式化。它提供了一种概念框架,可以帮助避免III型错误。该框架的关键要素称为损失函数。它包含两个参数:第一个是世界的真实状态(的相关子集)(例如,在参数估计问题中,真实参数值);第二个是一组可能动作中的一个元素(例如,在参数估计问题中,估计θθθ^)。输出对与世界上每种可能的真实状态有关的每种可能的动作所造成的损失进行建模。例如,在参数估计问题中,一些众所周知的损失函数是:

  • 绝对误差损失L(θ,θ^)=|θθ^|
  • 平方误差损失L(θ,θ^)=(θθ^)2
  • 哈尔瓦里安的LINEX损失L(θ,θ^;k)=exp(k(θθ^))k(θθ^)1, k0

检查答案以找到问题

在某些情况下,可能会试图通过着重于制定正确的损失函数并继续进行其余的决策理论方法(此处未详述)来避免III型错误。这不是我的简要介绍–毕竟,统计学家已经掌握了许多行之有效的技术和方法,即使它们并非源自这种方法。但是,在我看来,最终结果是绝大多数统计学家都不了解也不在乎统计决策理论,而且我认为他们不在了。对于那些统计学家,我认为他们之所以会发现统计决策理论在避免III类错误方面很有价值,是因为它提供了一个框架,可以在其中询问任何建议的数据分析程序:该程序可以最佳地应对什么损失函数(如果有)?也就是说,在什么决策情况下,它到底能提供最佳答案?

后预期损失

从贝叶斯角度来看,损失函数就是我们所需要的。我们几乎可以忽略决策理论的休息-几乎可以肯定,做的最好的事情是尽量减少后预期损失,也就是找到动作a最小化L~(a)=ΘL(θ,a)p(θ|D)dθ

?(至于非贝叶斯观点嗯,这是频率论决策理论的定理-具体来说,沃尔德的完全类定理 -即最佳动作永远是尽量减少贝叶斯后验预期损失相对于一些(可能是不当)这个结果的困难在于它是一个存在定理,没有给出关于使用哪个先验的指导,但是它有效地限制了我们可以“反转”以弄清楚到底是哪个问题的过程的类别。特别是,反转任何非贝叶斯程序的第一步是弄清楚它复制或近似哪个贝叶斯程序(如果有)。

嘿,青色,您知道这是一个问答网站,对吗?

最后,这使我提出了一个统计问题。在贝叶斯统计中,当为单变量参数提供间隔估计时,两个常见的可信间隔过程是基于分位数的可信间隔和最高后验密度可信间隔。这些程序背后的损失函数是什么?


非常好。但是,它们是证明这些程序合理的唯一损失函数吗?
2012年

1
@Cyan >>感谢您为我提问和回答:)我将阅读所有这些内容,并在可能的情况下进行投票。
斯蒂芬·洛朗

4
伯杰统计决策理论和贝叶斯分析有趣的一句话:“我们不认为可信集具有明确的决策理论作用,因此对选择可信集的'最优'方法持怀疑态度”
Simon Byrne 2012年

1
@Simon Byrne >> 1985年已经很久了;我不知道他是否仍然这么认为。
青色

1
@Cyan:我不知道,但是决策理论是贝叶斯统计数据的一部分,在过去27年中变化不大(有一些有趣的结果,但是Berger的书仍然是标准参考书),特别是与人气极小值进行比较时,得出常客统计数据。
西蒙·伯恩

Answers:


15

在单变量间隔估计中,可能的操作集合是指定间隔端点的有序对集合。让该集合的一个元素被表示为(a,b), ab

最高后密度间隔

令后验密度为。最高后验密度区间对应于损失函数,该函数对不能包含真实值的区间进行惩罚,并且还按其长度成比例地对区间进行惩罚:f(θ)

LHPD(θ,(a,b);k)=I(θ[a,b])+k(ba),0<kmaxθf(θ)

其中指标函数。这给出了预期的后路损失I()

L~HPD((a,b);k)=1Pr(aθb|D)+k(ba)

设置为参数空间内部的局部最优: –正好符合HPD间隔的规则。˚F=˚Fb=ķaL~HPD=bL~HPD=0f(a)=f(b)=k

的形式给出了一些洞察为什么HPD间隔不是不变的单调递增变换的参数的。转换为空间的 -space HPD间隔与 -space HPD间隔不同,因为两个间隔对应于不同的损失函数: -space HPD间隔对应于变换后的长度罚分。θθθθθL~HPD((a,b);k)g(θ)θg(θ)g(θ)g(θ)k(g(b)g(a))

基于分位数的可信区间

考虑使用损失函数进行点估计

Lq(θ,θ^;p)=p(θ^θ)I(θ<θ^)+(1p)(θθ^)I(θθ^), 0p1

后验预期损失为

L~q(θ^;p)=p(θ^E(θ|θ<θ^,D))+(1p)(E(θ|θθ^,D)θ^)

设置产生隐式方程ddθ^L~q=0

Pr(θ<θ^|D)=p

也就是说,最佳是后验分布的%分位数,与预期的一样。100pθ^(100p)

因此,为了获得基于分位数的区间估计,损失函数为

LqCI(θ,(a,b);pL,pU)=Lq(θ,a;pL)+Lq(θ,b;pU)


1
引起这种情况的另一种方法是将损失函数重写为间隔宽度加上距离(如果有的话)的(加权)和,间隔无法覆盖真实的。θ
来宾

还有其他方法可以考虑基于分位数的间隔,而不会直接引用分位数或间隔的长度。我希望“分位数间隔最大化/最小化平均/最小/最大/等等。某种度量”之类的东西
RasmusBååth2014年

@RasmusBååth,您基本上是在问,“将分位数间隔的损失函数作为最小化后验预期损失的解决方案的必要条件是什么?” 我的直觉,仅仅是从数学向前发展的方式来看,就差不多了。不过还没有证明。
青色

因此,我不确定损失函数,但是我知道一个过程,该过程取决于点损失函数,将导致HPD或分位数间隔。假设你有随机抽样从后平局。1.选择后损失最小的点,并将该点添加到间隔中。2.从删除该点,由于此删除,现在其余点的后损失可能会改变(取决于)。3.如果您的间隔达到要求的覆盖范围,请感到高兴,否则请从(1)开始重复。L = L0给出HPD,L = L1给出分位数间隔。小号小号小号小号大号LssssL
RasmusBååth2014年

5
只是提到贝叶斯选择第5.5.3节涵盖了基于损失的可信集推导...
西安

1

最小间隔

损失函数用于区间选择(贝叶斯和频繁主义者)的一个明显选择是使用根据边际分布度量的区间大小。因此,从所需的属性或损失函数开始,并得出最佳间隔。尽管有可能,但这往往无法做到,正如本问题所举例说明的那样。对于贝叶斯可信集,这对应于最小化区间的先验概率,或最大化相对置信度,例如Evans(2016)中所述。大小也可用于选择常客性置信集(Schafer 2009)。这两种方法是相关的,并且可以通过决策规则轻松实现,该决策规则优先包含具有大型点向互信息的决策(Bartels 2017)。

Bartels,C.,2017年。在常客测试中使用先验知识。无花果。 https://doi.org/10.6084/m9.figshare.4819597.v3

Evans,M.,2016年。使用相对信念来衡量统计证据。计算和结构生物技术杂志,第14页,第91-96页。

Schafer,CM和Stark,PB,2009。构建最佳预期规模的置信区域。美国统计协会杂志,104(487),第1080-1089页。


我看到您在引用Keith O'Rourke的建议(andrewgelman.com/2016/07/17/…)引用Evans 。我真的很喜欢Evans的东西。
Cyan

我很高兴收到Keith的通知,开始的工作有所不同,但得出的结论却差不多!重要的是要指出这一点。
user36160
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.