描述负二项式分布变量之间差异的分布?


18

一个Skellam分布描述了具有泊松分布的两个变量之间的区别。是否存在类似的分布来描述遵循负二项式分布的变量之间的差异?

我的数据是通过泊松过程生成的,但包含大量噪声,导致分布的过度分散。因此,使用负二项式(NB)分布对数据建模非常有效。如果要对这两个NB数据集之间的差异进行建模,我有哪些选择?如果有帮助,则假设两组的均值和方差相似。


有许多易于描述的发行版没有标准名称。
Glen_b-恢复莫妮卡2014年

Answers:


22

我不知道这种分布的名称,但是您可以根据总概率定律得出它。假设X,Y分别具有负二项式分布,其参数分别为(r1,p1)(r2,p2)。我正在使用参数化,其中X,Y表示第r1个和r2个故障之前的成功次数。然后,

P(XY=k)=EY(P(XY=k))=EY(P(X=k+Y))=y=0P(Y=y)P(X=k+y)

我们知道

P(X=k+y)=(k+y+r11k+y)(1p1)r1p1k+y

Pÿ=ÿ=ÿ+[R2-1个ÿ1个-p2[R2p2ÿ

所以

PX-ÿ=ķ=ÿ=0ÿ+[R2-1个ÿ1个-p2[R2p2ÿķ+ÿ+[R1个-1个ķ+ÿ1个-p1个[R1个p1个ķ+ÿ

那不是很好(赞!)。我唯一看到的简化就是

p1个ķ1个-p1个[R1个1个-p2[R2ÿ=0p1个p2ÿÿ+[R2-1个ÿķ+ÿ+[R1个-1个ķ+ÿ

这仍然很丑陋。我不确定这是否有帮助,但是也可以将其重写为

p1个ķ1个-p1个[R1个1个-p2[R2[R1个-1个[R2-1个ÿ=0p1个p2ÿÿ+[R2-1个ķ+ÿ+[R1个-1个ÿķ+ÿ

我不确定此和是否有简化表达式,但是如果只需要它来计算 -values,则可以用数字近似p

我通过仿真验证了上面的计算是正确的。这是一个粗略的R函数,用于计算该质量函数并进行一些模拟

  f = function(k,r1,r2,p1,p2,UB)  
  {

  S=0
  const = (p1^k) * ((1-p1)^r1) * ((1-p2)^r2)
  const = const/( factorial(r1-1) * factorial(r2-1) ) 

  for(y in 0:UB)
  {
     iy = ((p1*p2)^y) * factorial(y+r2-1)*factorial(k+y+r1-1)
     iy = iy/( factorial(y)*factorial(y+k) )
     S = S + iy
  }

  return(S*const)
  }

 ### Sims
 r1 = 6; r2 = 4; 
 p1 = .7; p2 = .53; 
 X = rnbinom(1e5,r1,p1)
 Y = rnbinom(1e5,r2,p2)
 mean( (X-Y) == 2 ) 
 [1] 0.08508
 f(2,r1,r2,1-p1,1-p2,20)
 [1] 0.08509068
 mean( (X-Y) == 1 ) 
 [1] 0.11581
 f(1,r1,r2,1-p1,1-p2,20)
 [1] 0.1162279
 mean( (X-Y) == 0 ) 
 [1] 0.13888
 f(0,r1,r2,1-p1,1-p2,20)
 [1] 0.1363209

[Rp1个p21个-p1个1个-p2


谢谢。我将需要一些时间来解决此问题,但是非常感谢您的帮助。
chrisamiller

-2

是。偏斜广义离散Laplace分布是两个负二项式分布随机变量之差。有关更多说明,请参见seetha Lekshmi.V提供的在线文章“偏斜广义离散Laplace分布”。和西米·塞巴斯蒂安


4
您能否提供本文的完整引文和信息摘要,以便将来的读者决定是否要这样做?
gung-恢复莫妮卡

@ simi-sebastian(作者?)提到的文章是ijmsi.org/Papers/Volume.2.Issue.3/K0230950102.pdf。但是,除非我弄错了,否则它只能解决负二项式变量的情况Xÿ两者具有相同的色散参数,而不是原始海报所描述的更一般的情况。
Constantinos
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.