负二项式分布和二项式分布有什么区别?
我尝试在线阅读,发现当数据点离散时使用负二项式分布,但是我认为即使二项分布也可以用于离散数据点。
负二项式分布和二项式分布有什么区别?
我尝试在线阅读,发现当数据点离散时使用负二项式分布,但是我认为即使二项分布也可以用于离散数据点。
Answers:
两者之间的差异是我们感兴趣的。这两个分布均基于具有固定成功概率p的独立Bernoulli试验建立。
对于二项分布,随机变量X是n次试验中观察到的成功次数。由于试验次数固定,因此X的可能值为0、1,...,n。
对于负二项式分布,随机变量Y是直到观察到第r次成功为止的试验次数。在这种情况下,我们不断增加试验的次数,直到我们达到[R成功。Y的可能值为r,r + 1,r + 2,...,没有上限。负二项式也可以在数量来定义的故障,直到ř个成功,代替的数目的试验,直到 r次成功。维基百科以此方式定义负二项分布。
总结一下:
二项式:
负二项式:
感谢Ben Bolker提醒我提及两个发行版的支持。他在这里回答了一个相关的问题。
负二项式分布尽管与二项式看似很明显,但与泊松分布相比实际上更好。三者都是离散的。
如果您的数据表明方差大于均值(过度分散),则排除了泊松效应,那么负二项式将是下一个要考虑的分布。它具有多个参数,因此其方差可以大于平均值。
NB与二项式的关系来自基础过程,如@Jelsema的答案所述。流程是相关的,所以分布也是如此,但是正如我在这里所解释的,在实际应用中与Poisson分布的联系更加紧密。
更新:另一个方面是参数化。二项式分布有两个参数:p和n。它的真实域是0到n。因为它不仅是离散的,而且是在有限的一组数字上定义的。