离散函数:置信区间覆盖范围?


9

如何计算离散间隔覆盖率?

我知道该怎么做:

如果我有一个连续模型,则可以为每个预测值定义一个95%的置信区间,然后查看实际值在该置信区间内的频率。我可能会发现,只有88%的时间我的95%置信区间覆盖了实际值。

我不知道该怎么办:

我如何针对离散模型(例如泊松或伽马泊松)执行此操作?我对此模型的了解如下,进行一次观察(我计划生成的100,000多个样本中:)

观察值#:(任意)

预测值:1.5

0的预测概率:.223

的预测概率为1:.335

2的预测概率:.251

3:3的预测概率

4的预测概率:.048

5的预测概率:.014 [且5或更大是.019]

...(等等)

预测的100的概率(或某个其他不现实的数字):. 000

实际值(例如“ 4”的整数)

请注意,尽管我在上面给出了泊松值,但在实际模型中,预测值1.5可能在各个观测值之间具有0.1,... 100的不同预测概率。

我对值的离散性感到困惑。“ 5”显然超出了95%的区间,因为在5以上,只有.019,小于.025。但是会有很多4-单独存在于其中,但是我如何共同评估4的数量呢?

我为什么在乎?

我正在查看的模型在总体水平上是准确的,但给出的个人预测却不佳。我想看看不良的个人预测比模型所预测的固有的宽置信区间差多少。我希望经验覆盖范围会更糟(例如,我可能会发现88%的值都在95%的置信区间内),但我希望只会稍微差一点。

Answers:


6

Neyman的置信区间不会尝试在任何特定区间的情况下提供参数的覆盖范围。相反,从长远来看,它们可以覆盖所有可能的参数值。从某种意义上说,它们试图以局部精度为代价来实现全局精度。

二项式比例的置信区间清楚地说明了这个问题。区间的Neymanian评估得出这样的不规则覆盖图,对于n = 10二项式试验,这是95%Clopper-Pearson区间的结果:

Clopper-Pearson覆盖图

有另一种覆盖方法,我个人认为这是更直观易用且(因此)有用的方法。可以根据观察结果指定间隔的覆盖范围。该覆盖范围将是本地覆盖范围。这是一个曲线图,显示了针对二项式比例的置信区间的三种不同计算方法的局部覆盖率:Clopper-Pearson,Wilson得分以及有条件精确方法,其得出与贝叶斯区间相同且先验统一的区间:

三种间隔的条件覆盖

请注意,95%的Clopper-Pearson方法给出了98%以上的局部覆盖率,但是确切的条件间隔是精确的。

考虑全局和局部区间差异的一种方法是,将全局视为内曼-皮尔森假设检验的反演,其中结果是基于对当前长期误差率的考虑而做出的决策作为可能运行的所有实验的全局集合的成员进行实验。局部区间更类似于Fisherian显着性检验的倒置,其产生一个P值,该值表示对该特定实验无效的证据。

(据我所知,全球统计与本地统计之间的区别首先是由克莱尔·莱斯利(Claire F Leslie,1998)在未发表的硕士学位论文中进行的。统计推断,特别是对置信区间理论的参考(该论文由墨尔本大学的Baillieu图书馆持有)。


2
我不认为克莱尔·莱斯利(Claire Leslie)发明了全球/本地区别,但她确实对此进行了精美详尽的描述,并提供了许多参考。我太强烈推荐她的论文。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.