如何计算离散间隔覆盖率?
我知道该怎么做:
如果我有一个连续模型,则可以为每个预测值定义一个95%的置信区间,然后查看实际值在该置信区间内的频率。我可能会发现,只有88%的时间我的95%置信区间覆盖了实际值。
我不知道该怎么办:
我如何针对离散模型(例如泊松或伽马泊松)执行此操作?我对此模型的了解如下,进行一次观察(我计划生成的100,000多个样本中:)
观察值#:(任意)
预测值:1.5
0的预测概率:.223
的预测概率为1:.335
2的预测概率:.251
3:3的预测概率
4的预测概率:.048
5的预测概率:.014 [且5或更大是.019]
...(等等)
预测的100的概率(或某个其他不现实的数字):. 000
实际值(例如“ 4”的整数)
请注意,尽管我在上面给出了泊松值,但在实际模型中,预测值1.5可能在各个观测值之间具有0.1,... 100的不同预测概率。
我对值的离散性感到困惑。“ 5”显然超出了95%的区间,因为在5以上,只有.019,小于.025。但是会有很多4-单独存在于其中,但是我如何共同评估4的数量呢?
我为什么在乎?
我正在查看的模型在总体水平上是准确的,但给出的个人预测却不佳。我想看看不良的个人预测比模型所预测的固有的宽置信区间差多少。我希望经验覆盖范围会更糟(例如,我可能会发现88%的值都在95%的置信区间内),但我希望只会稍微差一点。