如何计算泊松分布的置信度?


32

想知道我对自己的有多自信。有人知道为Poisson分布设置上下置信度的方法吗?λ

  • 观察值()= 88n
  • 样本平均值()= 47.18182λ

95%的信心会是什么样?


您也可以考虑引导您的估算。是有关引导的简短教程。
Mark T Patterson

Answers:


27

对于泊松,均值和方差均为。如果要在lambda附近置信区间,则可以将标准误计算为λλ/n

95%的置信区间为λ ± 1.96 λ^±1.96λ^/n


26
这是细时是大的,则泊松充分通过正态分布近似。对于较小的值或较高的置信度,可以使用更好的间隔。请参阅math.mcmaster.ca/peter/s743/poissonalpha.html中的两个内容,以及对其实际覆盖范围的分析。(在这里,“精确”间隔为(45.7575,48.6392),“皮尔逊”间隔为(45.7683,48.639),“正态”近似值为(45.7467,48.617):有点太低了,但是足够接近了,因为n λ = 4152。)nλnλ=4152
呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜用途用途干终于明零里((

4
对于像我一样感到困惑的其他人:是1.96来源的描述。
mjibson 2012年

2
考虑到Whuber在该网站上提供的信息,您如何计算此问题的确切间隔?我无法追踪,因为该网站似乎仅指示您有一个样本时如何进行。也许我只是不了解简单的东西,但是我的分布的lambda(n)值要小得多,所以我不能使用正态近似,也不知道如何计算精确值。任何帮助将不胜感激。谢谢!

他们在这里使用均值的标准差吗?也就是说,SE = sig/sqrt(N) = sqrt(lam/N)?这是有道理的,因为单个值的标准偏差sig告诉我们从Poisson分布中抽取随机样本的可能性,而给定用于采样的样本数量,SE上述定义的告诉我们关于的可信度lam
AlexG


7

除了其他人提供的答案之外,通过基于模型的方法还可以解决该问题。中心极限定理方法肯定是有效的,并且自举估计法为小样本和模式错误指定问题提供了很多保护。

为了提高效率,您可以通过使用基于回归模型的方法来获得更好的置信区间。无需进行推导,但是R中的简单计算如下:λ

x <- rpois(100, 14)
exp(confint(glm(x ~ 1, family=poisson)))

请注意,这是一个非对称间隔估计,因为泊松glm的自然参数是对数相对速率!这是一个优点,因为计数数据倾向于向右倾斜。

上面的方法有一个公式,它是:

exp(logλ^±1nλ^)

该置信区间在某种意义上是“有效的”,它来自泊松数据的自然参数(对数)标度上的最大似然估计,并且在保持标称95%覆盖率的同时,提供了比基于计数标度的置信区间更小的置信区间。 。


+1我想我会使用与效率不同的形容词(或者更清楚地说,您指的是计算效率或代码效率)。whuber的评论指向一种提供精确间隔的资源,而glm方法也基于渐近结果。(不过,它更笼统,所以我也建议您采用这种方法。)
Andy W

实际上,需要进一步考虑,仅当您指定而不查看数据时,才能使用(我认为)确切的覆盖率链接。查看快速模拟,根据观测值(对于新观测值)计算的覆盖范围要低得多。快速仿真在这里μ
安迪W

1
您对该公式的权限是什么?我们可以引用吗?
pauljohn32 '18

@AndyW:您的链接对快速仿真无效
pauljohn32 '18

1
@ pauljohn32特别是在指数族中查看Casella Berger的文本,对数率是自然参数。
AdamO '18 -4-4

5

根据泊松分布的观察

  • 计数的事件数为n。
  • 的平均值()和方差(σ 2)是相等的。λσ2

一步步,

  • λ^=nλ
  • n>20σ

stderr=σ=λn

现在,95%的置信区间

I=λ^±1.96 stderr=n±1.96 n

[编辑]基于问题数据的一些计算,

  • λ

    我做出这个假设是因为原始问题并未提供有关实验或如何获取数据的任何背景信息(在处理统计数据时,这是至关重要的)。

  • 在特定情况下,95%的置信区间为

I=λ±1.96 stderr=λ±1.96 λ=47.18182±1.96 47.18182[33.72,60.64]

因此,由于测量(n = 88个事件)超出了95%的置信区间,因此我们得出结论,

  1. 该过程不遵循泊松过程,或者

  2. λ


λ/n


1
λnλ

2
λλ

2
我相信上述jose.angel.jiminez的回答是不正确的,并且是由于对原始问题的误读引起的。原始海报显示“观察数(n)= 88”-这是观察到的时间间隔数,而不是整体或每个间隔观察到的事件数。在88个观察间隔的样本中,每个间隔的平均事件数是原始海报给出的lambda。(我已经将此内容作为对Jose帖子的评论,但对网站而言太新了,
不可以

@ user44436添加了应该是评论的答案。我将其重新发布为评论,以便您可以看到它,并且由于无法回答,它可能会被删除:------- 我认为以上jose的回答是不正确的,并且是由于对原始问题的误读引起的。原始海报显示观察值(n)= 88-这是观察到的时间间隔数,而不是整体或每个间隔观察到的事件数。在88个观察间隔的样本中,每个间隔的平均事件数是原始海报给出的lambda。
莫尔2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.