计算“实际覆盖概率”是否与计算“可信区间”相同?


10

我正在阅读入门级统计教科书。在关于二项式分布数据中成功比例的最大似然估计一章中,它给出了计算置信区间的公式,然后毫无保留地提及

考虑其实际覆盖率,即该方法产生捕获真实参数值的间隔的概率。这可能比标称值小很多。

并建议构建一个替代的“置信区间”,该区间可能包含实际的覆盖概率。

我第一次遇到标称覆盖率和实际覆盖率的想法。通过这里的旧问题,我想我已经理解了:有两个不同的概念,我们称为概率,第一个是尚未发生的事件将产生给定结果的可能性,第二个是观察者对已经发生的事件的结果的猜测是多么真实。似乎置信区间只测量第一种类型的概率,而所谓的“可信区间”则测量第二种类型的概率。我概括地说,置信区间是计算“名义覆盖率”的区间,可信区间是覆盖“实际覆盖率”的区间。

但是也许我对这本书有误解(尚不清楚它提供的不同计算方法是针对置信区间和可信区间,还是针对两种不同类型的置信区间),或者我曾经使用过其他资料我目前的理解。特别是我对另一个问题的评论,

置信区间为常客,贝叶斯可信

我怀疑我的结论,因为这本书没有在该章中描述贝叶斯方法。

因此,请澄清我的理解是正确的,还是我在途中犯了逻辑错误。


名义覆盖率是“目标”覆盖率:当我们推导提供置信区间的方法时,我们尝试达到的覆盖率。实际覆盖范围是“真实”覆盖范围。有人说,当实际覆盖率等于名义覆盖率时,置信区间是准确的。Scotchi和Unwisdom提到,对于离散数据,置信区间永远不会精确。另一个示例是当我们使用渐近置信区间时:仅当时才是精确的。我完全理解您的想法,因为“实际”也是“当下”的同义词。n
斯特凡洛朗

Answers:


5

通常,使用离散分布时,实际覆盖率永远不会等于标称概率。

置信区间定义为数据的函数。如果您使用二项式分布,则只有有限的许多可能结果(准确地说是),因此只有有限的许多可能的置信区间。由于参数是连续的,因此很容易看到覆盖率(是的函数)的总和不能比大约95%(或其他任何值)更好。n+1pp

通常,基于CLT的方法将具有低于标称值的覆盖率,但是其他方法实际上可能更为保守。


1
这是定义的一个有用的正式说明:给定样本空间和未知参数,置信过程由一对函数这样该表达式的左侧是(注意,它取决于θ),而RHS是标称置信度。如果LHS 的最小值(超过)等于RHS,则该过程是准确的Ω,F,Pθ1α LU:ΩR
P[{ωΩ|[L(ω),U(ω)]θ}]1α.
coverage probabilityΩ
智慧2014年

8

这与贝叶斯可信区间与频繁性置信区间无关。95%的置信区间定义为无论参数的真实值如何,至少覆盖95%。因此,当标称覆盖范围为95%,实际的覆盖范围可以是97%,当,96.5%时,但对于没有的值是小于95%。问题(即名义覆盖率与实际覆盖率之间的差异)是由离散分布(如二项式)引起的。ππ=π1π=π2π

例如,考虑从二项式试验中以成功概率未知的成功观察: 第一列显示的可能观测值。第二个显示精确的上限置信区间xnπ

xπUPr(X=x|π=0.7)I(πU0.7)00.39303780.000729010.58180340.010206020.72866160.059535130.84683890.185220140.93715010.324135150.99148760.302526161.00000000.1176491
x 95%πU=π:[Pr(X>x|π)=0.95]您将在每种情况下计算的费用。现在假设:第三列显示在此假设下的每个观测值的概率;第四个显示了在哪些情况下计算出的置信区间覆盖了真实参数值,并用标记它们。如果将置信区间确实覆盖真实值的情况的概率加起来,则得到的实际覆盖率为。对于不同真实值,实际覆盖范围将有所不同:π=0.7x10.989065π

覆盖范围

仅当真实参数值与可获得的上限一致时,才能实现名义覆盖。

[我只是重新阅读了您的问题,并注意到作者说实际数字可能小于标称覆盖率。因此,我认为他们正在谈论一种计算置信区间的近似方法,尽管我上面所说的仍然有效。该图可能表明报告的平均置信度约为但是-平均未知参数的值?]98%

†确切地讲,对于任何值,实际覆盖范围都不会小于名义覆盖范围,对于某些值,它等于该覆盖范围-@Unwisdom的含义,而不是@Stephane的含义。ππ

‡当然,上限和下限的区间更常用;但解释起来有点复杂,而且只有一个确切的时间间隔可以考虑,只是一个上限。(见Blaker(2000),“信心曲线和离散分布改善精确置信区间”,加拿大杂志统计28 4,&的参考文献。)


感谢您的回答。既然我知道实际的覆盖概率是多少,您是否可以猜出为什么这个问题的用户被发送到解释可信区间和可信区间之间差异的问题?这是我得到实际/名义覆盖率概率的地方。二元性有关。 stats.stackexchange.com/questions/63922/...
rumtscho

可能是因为OP仅链接到他所看到的术语“标称”和“实际”(而不是像您一样在问题中进行总结或引用),然后将他的其余问题专门用于他对它们的误解在这种情况下使用。
Scortchi-恢复莫妮卡

2

我认为差异实际上是在计算置信区间时使用近似值。例如,如果我们使用相当标准的CI

estimate±1.96×estimated standard error

我们可以将其称为“ 95%置信区间”。但是,通常情况是在这里进行几种近似。如果我们不做近似,那么我们可以计算出实际覆盖率。一种典型情况是估计标准误差。然后,间隔太窄而无法以95%的概率捕获真实值。他们可能只能以85%的概率捕获真实值。可以使用某种蒙特卡洛模拟来计算“实际覆盖”概率(例如,使用选定的真实值生成样本数据集,然后为每个样本值计算95%CI,并发现实际包含真实值)。1000850

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.