负二项分布与二项分布


22

负二项式分布和二项式分布有什么区别?

我尝试在线阅读,发现当数据点离散时使用负二项式分布,但是我认为即使二项分布也可以用于离散数据点。


5
他们都是离散的。
Glen_b-恢复莫妮卡

5
简单说明:您正在挨家挨户销售糖果。在您打开的每扇门上,您有1/4的概率出售1个直板糖果,而有3/4的概率出售0个直板糖果。如果您敲开50扇门,则卖出n条的概率是n中的二项式分布。您可能要敲m个门才能卖出30个金条,这是m的负二项式分布。请注意,前者的价格是50,因为您不能卖出超过50的金条,而后者的价格是无穷大,因为那一天您可能运气不佳,从不出售30的价格。
杰里·根(Jerry Guern)

Answers:


30

两者之间的差异是我们感兴趣的。这两个分布均基于具有固定成功概率p的独立Bernoulli试验建立。

对于二项分布,随机变量Xn次试验中观察到的成功次数。由于试验次数固定,因此X的可能值为0、1,...,n

对于负二项式分布,随机变量Y是直到观察到第r次成功为止的试验次数。在这种情况下,我们不断增加试验的次数,直到我们达到[R成功。Y的可能值为rr + 1r + 2,...,没有上限。负二项式也可以在数量来定义的故障,直到ř个成功,代替的数目的试验,直到 r次成功。维基百科以此方式定义负二项分布。

总结一下:

二项式

  • 固定试验次数(n
  • 成功的固定概率(p
  • 随机变量为X =成功次数。
  • 可能的值是0≤ XÑ

负二项式

  • 固定的成功次数(r
  • 成功的固定概率(p
  • 随机变量为Y =直到第r次成功的试验次数。
  • 可能的值有[Rÿ

感谢Ben Bolker提醒我提及两个发行版的支持。他在这里回答了一个相关的问题。


4
有关NB的更多讨论,请访问:stats.stackexchange.com/questions/6728/…。可能值得注意的是,二项式响应是有界的[0,N],NB响应是无界的[0,...]
Ben Bolker

好点,我已经更新了答案以包含此内容。
耶尔瑟玛(Jelsema)

感谢jelsema的详细解答,我现在可以更好地了解它了
2015年

19

负二项式分布尽管与二项式看似很明显,但与泊松分布相比实际上更好。三者都是离散的。

λλ

如果您的数据表明方差大于均值(过度分散),则排除了泊松效应,那么负二项式将是下一个要考虑的分布。它具有多个参数,因此其方差可以大于平均值。

NB与二项式的关系来自基础过程,如@Jelsema的答案所述。流程是相关的,所以分布也是如此,但是正如我在这里所解释的,在实际应用中与Poisson分布的联系更加紧密。

更新:另一个方面是参数化。二项式分布有两个参数:p和n。它的真实域是0到n。因为它不仅是离散的,而且是在有限的一组数字上定义的。

λñ


3
我不理解“与泊松分布相比更好”的意思。最初的问题并没有说明需要哪种建模。它甚至不暗示人们对建模完全感兴趣。
heropup 2015年

@ heropup,OP显然对应用程序感兴趣,并直接将NB与Binomial进行了比较。因此,我的答案是关于这种比较,并且与泊松的比较在典型应用中更为相关。
阿克萨卡(Aksakal)2015年

7

它们都是离散的,代表采样时的计数。

二项式分布表示预先确定抽奖次数的实验中的成功次数,例如,假设从制造过程中随机选择三项,并对每一项进行检查并分类为缺陷, d 或无缺陷, ñ ,我们看到在这种情况下的样本空间是 小号=dddddñdñddñññddñdñññdñññ

由于负二项式表示失败的次数,直到您绘制一定数量的成功为止。考虑相同的示例,并假设实验是随机抽样项目,直到观察到一个缺陷项目。那么这种情况的样本空间是小号=dñdññdñññd

因此,二项式在固定数量的试验中计算成功,而负二项式计算失败直到固定数成功,但是对于两者,我们都在用替换进行绘图,这意味着每个试验都有固定的概率 p 成功。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.