Answers:
这是一个相当直接的问题。尽管泊松分布与负二项式分布之间存在联系,但实际上,这对您的特定问题没有帮助,因为它鼓励人们思考负二项式过程。基本上,您有一系列的泊松过程:
其中,是过程,是您观察它的时间,i表示个体。您说这些过程通过分配将费率捆绑在一起是“相似的”:
通过进行集成/,您具有:
pmf为:
为了获得等待时间分布,我们注意到:
= 1 - (1 − p i )α = 1 − ( 1 +
对此进行区分,即可得到PDF:
这是II型广义Pareto分布的成员。我将其用作您的等待时间分配。
要查看与泊松分布的联系,请注意,因此,如果我们设置,然后取的限制我们得到:β=α α→交通∞
这意味着您可以将为过度分散参数。
一种可能性:泊松就是指数,而负二项式就是……指数!
有一个纯跳跃增加的Lévy过程,称为负二项式过程,因此在时间该值具有负二项式分布。与泊松过程不同,跳跃几乎并不确定。相反,它们遵循对数分布。根据总方差定律,一些方差来自跳跃次数(由跳跃的平均大小缩放),而一些方差来自跳跃的大小,您可以使用它来检查它是否过于分散。
可能还有其他有用的描述。请参阅“为DNA测序构建负二项式分布”。
让我更明确地说明如何构建上述负二项式过程。
选择。
让是具有对数分布的IID,因此P (x i = k )= − 1
让是泊松过程以恒定速率- 日志(1 - p ),所以Ñ (吨)= 的POI (- 吨数(1 - p ))。
令为过程,这样
是具有对数分布跳跃的纯跳跃过程。跳跃之间的间隙遵循速率的指数分布 - 日志(1 - p )。
我不认为从该描述中可以明显看出具有负二项式N B (t ,p )分布,但是在Wikipedia上有使用概率生成函数的简短证明,Fisher在他介绍了对数分布来分析物种的相对频率。
我还不能发表评论,因此我很抱歉,这不是一个确定的解决方案。
您正在要求与NB一起使用的适当发行版,但尚未完全定义适当的发行版。如果适当的分布方式适合于解释数据,而您是从过度分散的Poisson开始的,那么您可能必须进一步研究过度分散的原因。NB不会区分具有不同均值的Poisson还是正发生依赖关系(一个事件发生会增加另一个事件发生的可能性)。在连续时间内,还存在持续时间依赖性,例如正的持续时间依赖性意味着时间的流逝增加了发生的可能性。还显示出负持续时间依赖性会渐近地导致泊松分布过度[1]。这将添加到合适的等待时间模型列表中。