这与贝叶斯可信区间与频繁性置信区间无关。95%的置信区间定义为无论参数的真实值如何,至少覆盖95%。因此,当标称覆盖范围为95%,实际的覆盖范围可以是97%,当,96.5%时,但对于没有的值是小于95%。问题(即名义覆盖率与实际覆盖率之间的差异)是由离散分布(如二项式)引起的。ππ=π1π=π2π
例如,考虑从二项式试验中以成功概率未知的成功观察:
第一列显示的可能观测值。第二个显示精确的†上限‡置信区间xnπ
x0123456πU0.39303780.58180340.72866160.84683890.93715010.99148761.0000000Pr(X=x|π=0.7)0.0007290.0102060.0595350.1852200.3241350.3025260.117649I(πU≤0.7)0011111
x 95%πU=π:[Pr(X>x|π)=0.95]您将在每种情况下计算的费用。现在假设:第三列显示在此假设下的每个观测值的概率;第四个显示了在哪些情况下计算出的置信区间覆盖了真实参数值,并用标记它们。如果将置信区间确实覆盖真实值的情况的概率加起来,则得到的实际覆盖率为。对于不同真实值,实际覆盖范围将有所不同:
π=0.7x10.989065π
仅当真实参数值与可获得的上限一致时,才能实现名义覆盖。
[我只是重新阅读了您的问题,并注意到作者说实际数字可能小于标称覆盖率。因此,我认为他们正在谈论一种计算置信区间的近似方法,尽管我上面所说的仍然有效。该图可能表明报告的平均置信度约为但是-平均未知参数的值?]98%
†确切地讲,对于任何值,实际覆盖范围都不会小于名义覆盖范围,对于某些值,它等于该覆盖范围-@Unwisdom的含义,而不是@Stephane的含义。ππ
‡当然,上限和下限的区间更常用;但解释起来有点复杂,而且只有一个确切的时间间隔可以考虑,只是一个上限。(见Blaker(2000),“信心曲线和离散分布改善精确置信区间”,加拿大杂志统计,28 4,&的参考文献。)