泊松是指数级的,就像伽玛泊松是什么一样?


16

泊松分布可以测量单位时间内的事件,参数为。指数分布使用参数度量直到下一个事件的时间。一个可以将一个分布转换为另一个分布,这取决于对事件或时间进行建模更容易。λ1λ

现在,伽马-泊松是具有较大差异的“拉伸”泊松。威布尔分布是具有较大方差的“拉伸”指数。但是,可以像将Poisson转换成指数一样,轻松地将二者转换为彼此吗?

还是有一些其他分布更适合与伽马-泊松分布结合使用?

伽马泊松也称为负二项分布或NBD。

Answers:


14

这是一个相当直接的问题。尽管泊松分布与负二项式分布之间存在联系,但实际上,这对您的特定问题没有帮助,因为它鼓励人们思考负二项式过程。基本上,您有一系列的泊松过程:

Yi(ti)|λiPoisson(λiti)

其中,是过程,是您观察它的时间,i表示个体。您说这些过程通过分配将费率捆绑在一起是“相似的”:Yitii

λiGamma(α,β)

通过进行集成/,您具有:λi

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

pmf为:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

为了获得等待时间分布,我们注意到:

= 1 - 1 p i α = 1 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

对此进行区分,即可得到PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

这是II型广义Pareto分布的成员。我将其用作您的等待时间分配。

要查看与泊松分布的联系,请注意,因此,如果我们设置,然后取的限制我们得到:β=ααβ=E(λi|αβ) α→交通β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

这意味着您可以将为过度分散参数。1α


1
您还可以注意到,等待时间分布大致来说是具有Gamma随机率参数的指数分布,严格来说,这是第二种Beta分布,对于任何具有Gamma随机率参数的Gamma分布而言。
斯蒂芬·洛朗

使用@probabilityislogic作为基础,我发现以下文章提供了有关NBD与帕累托之间关系的更多详细信息:Gupta,Sunil和Donald G. Morrison。估计消费者购买率中的异质性。市场科学,1991,10(3),264-269。感谢所有帮助我回答这个问题的人。
zbicyclist 2012年

+1,我猜想对于,这种好的解析形式可能不再存在,其中是常数。ÇPoisson(λiti+c)c
Randel

1
@randel-您可以通过注意到该rv是两个独立的和来获得“漂亮”的形式...其中与上述相同,而。由于不依赖于或,因此的pdf 是上述负二项式pdf和泊松pdf的卷积。要获得等待时间分布,只需将以上答案中的乘以。然后,您将获得等待时间cdf 和Zi=Yi+XiYiXipoisson(c)XiλiYiZiPr(Yi=0)Pr(Xi=0)=ec1ec(1+tiβ)αecαβ(1+tiβ)(α+1)
概率

1
就混合分布而言,这将不起作用,因为您需要(否则泊松均值为负)。伽马混合分布将需要被截断(我在上一个答案中还假设)。这将意味着没有nb分布。λi<cti1c>0
概率

4

一种可能性:泊松就是指数,而负二项式就是……指数!

有一个纯跳跃增加的Lévy过程,称为负二项式过程,因此在时间该值具有负二项式分布。与泊松过程不同,跳跃几乎并不确定。相反,它们遵循对数分布。根据总方差定律,一些方差来自跳跃次数(由跳跃的平均大小缩放),而一些方差来自跳跃的大小,您可以使用它来检查它是否过于分散。t1

可能还有其他有用的描述。请参阅“为DNA测序构建负二项式分布”。


让我更明确地说明如何构建上述负二项式过程。

  • 选择p<1

  • 是具有对数分布的IID,因此P x i = k = 1X1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • 是泊松过程以恒定速率- 日志1 - p ,所以Ñ = 的POI - 1 - p Nlog(1p)N(t)=Pois(tlog(1p)).

  • 为过程,这样NBP

NBP(t)=i=1N(t)Xi.

是具有对数分布跳跃的纯跳跃过程。跳跃之间的间隙遵循速率的指数分布 - 日志1 - p NBPlog(1p).

我不认为从该描述中可以明显看出具有负二项式N B t p 分布,但是在Wikipedia上使用概率生成函数简短证明Fisher在他介绍了对数分布来分析物种的相对频率。NBP(t)NB(t,p)


1
不,任何复合泊松过程都有指数等待时间。这意味着你添加 IID随机变量与一些分布。Pois(λt)
Douglas Zare 2012年

NN

2


0

我还不能发表评论,因此我很抱歉,这不是一个确定的解决方案。

您正在要求与NB一起使用的适当发行版,但尚未完全定义适当的发行版。如果适当的分布方式适合于解释数据,而您是从过度分散的Poisson开始的,那么您可能必须进一步研究过度分散的原因。NB不会区分具有不同均值的Poisson还是正发生依赖关系(一个事件发生会增加另一个事件发生的可能性)。在连续时间内,还存在持续时间依赖性,例如正的持续时间依赖性意味着时间的流逝增加了发生的可能性。还显示出负持续时间依赖性会渐近地导致泊松分布过度[1]。这将添加到合适的等待时间模型列表中。


1
过度分散的原因:这是消费者购买数据。个体消费者是泊松,每个人都有购买的λ值。但是,并非每个消费者都有相同的λ值-这就是过度分散的原因。λ购买率被视为以伽马分布。这是一个常见的模型(可以追溯到ASC Ehrenberg),但是我在他的著作中没有发现任何答案。
zbicyclist 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.