这是一个基本问题,但我找不到答案。我有两个测量值:时间t1中的n1个事件和时间t2中的n2个事件,它们都是由泊松过程(可能具有不同的lambda值)产生的。
这实际上是来自新闻文章,该文章本质上声称自以来,两者是不同的,但是我不确定该声明是否有效。假设未恶意选择时间段(以最大化一个或另一个事件)。
我可以做一个t检验,还是不合适?对于我来说,事件的数量太少了,无法轻松地将分布称为正常分布。
这是一个基本问题,但我找不到答案。我有两个测量值:时间t1中的n1个事件和时间t2中的n2个事件,它们都是由泊松过程(可能具有不同的lambda值)产生的。
这实际上是来自新闻文章,该文章本质上声称自以来,两者是不同的,但是我不确定该声明是否有效。假设未恶意选择时间段(以最大化一个或另一个事件)。
我可以做一个t检验,还是不合适?对于我来说,事件的数量太少了,无法轻松地将分布称为正常分布。
Answers:
为了检验泊松均值,有条件的方法由Przyborowski和Wilenski(1940)提出。给定X1 + X2时,X1的条件分布遵循二项式分布,其成功概率是两个Lambda比率的函数。因此,可以从推断二项式成功概率的确切方法中轻松开发假设检验和区间估计程序。为此通常考虑两种方法:
您可以在本文中找到有关这两个测试的详细信息。 比较两个Poisson均值的更强大测试
您正在寻找一种快速简便的检查方法。
在比率(lambda值)等于的零假设下,您可以将这两个测量值视为观察单个过程的时间,并对间隔的事件进行计数(数量为)和间隔内的事件(数量为)。您可以将费率估算为吨= 吨1 + 吨2 [ 0 ,吨1 ] Ñ 1 [ 吨1,吨1 + 吨2 ] Ñ 2
然后可以估计的分布:它们是附近强度的泊松。如果中的一个或两个都位于此分布的尾部,则该索赔很可能是有效的;如果不是,则索赔可能依赖于偶然性变化。Ť 我λ Ñ 我
我对置信区间比对ap值更感兴趣,这是自举近似。
首先计算间隔的长度,然后进行检查:
Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)
[1] 2.000276
此检查给出的结果(增加了100.03%)与出版物中的结果(增加了101%)略有不同。继续执行引导程序(执行两次):
N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))
2.5% 25% 50% 75% 97.5% mean sd
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660
2.5% 25% 50% 75% 97.5% mean sd
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706
增长的95%置信区间为31%至202%。