从中提取without时,其概率分布是否会发生变化,而无需平均替换?


9

假设我的骨灰盒包含N种不同颜色的球,每种颜色可以出现不同的次数(如果有10个红色球,那么也不必有10个蓝色球)。如果在绘制之前知道know的确切内容,我们可以形成离散的概率分布,该分布告诉我们绘制每种颜色的球的概率。我想知道的是,平均没有从骨灰盒取下k个球后,分布如何变化。我了解到,随着我们从骨灰盒中提取物品,我们可以根据已取出的知识更新分布,但是我想知道的是,在移除k个球之后,我们期望分布的形状是什么。分布是平均变化还是保持不变?如果不保持相同,是否可以写出一些公式,以便在进行k次绘制后,我们期望新分布的平均外观如何?


1
我可能是错的-但这感觉就像是知道先验分布,但没有任何可能性的信息(除了删除了k个球)。在那种情况下-我会认为后验等于前验。公平地讲,存在这样的可能性信息:球的数量减少了,并且(对于移除的一个球)分布是例如在9%的红色和10个黑色的可能性为50%和10个红色的和9个黑色的可能性为50%之间的双峰分布。我可能在这里错了
Wouter

我的直觉是,就像您描述的后一种情况一样。我找不到任何谈论这种过程的人。
mjnichol

Answers:


7
  1. “直接计算”:the中有个颜色的球。让我们集中讨论在第二次绘制时绘制一种特定颜色(例如白色)的可能性。令白球的数量为。令为在第平局获得的球的颜色。Ñ 瓦特X nmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    当然,该参数同样适用于第二次绘制的任何颜色。在考虑以后的绘制时,我们可以递归地应用相同类型的参数。

    [当然可以执行更直接的计算。认为前平局由白球和非白球组成(概率由超几何分布给出),并针对上述简单的步骤执行相应的计算,但在步骤进行平局;人们得到了类似的简化和取消,但是执行起来并没有特别的启发。]i k i k + 1kikik+1

  2. 一个简短的论点是:考虑用数字随机标记球,然后按标记顺序将它们画出。现在的问题变成“给定标签放置在白球上的概率与标签放置在白球上的概率是否相同?”k 11,2,...,nk1

    现在我们看到答案在标签的对称性上必须为“是”。同样,通过对称的球形颜色,我们说“白色”也没关系,因此标签和标签具有相同概率的论点适用于任何颜色。因此,第抽签的分布与第一次抽签的分布相同,只要我们没有较早抽签的其他信息即可(即,只要看不到较早抽签的球)。1k1k


与您的第二种方法紧密相关的是另一个简短的论点:想象一下所有可能去除球的序列(例如,先是蓝色,然后是白色,然后是白色,...可能就是这样的序列)。如果对于该集合中的每个序列,我们交换和元素,则只需置换集合。因此,对于位置有白色(或其他任何东西)球的每个序列,正好有一个位置有白色球的对应序列。因此,在位置或位置上出现白球的概率必须相同。我认为这本质上是尼尔的观点。 k t h k 1 k 11stkthk1k1
银鱼

@Silverfish是的,看着它,我的第二个参数本质上与Neil的置换参数相同。
Glen_b-恢复莫妮卡2015年

感谢您的解释。这正是我需要看的!
mjnichol

6

分布保持不变(假设至少剩下一个球)并不是唯一显而易见的唯一原因是信息太多。让我们剥离分散注意力的材料。

暂时忽略每个球的颜色。 专注于一个球。假设球将被随机移除(而不观察),然后将绘制并观察一个球。选择发生的顺序没有什么区别,因此您最好观察第一个绘制的球(如果您坚持要再移出另一个球)。分布显然没有改变,因为移除其他球不会受到影响。k + 1 k kkk+1kk


这个论点-尽管完全正确-可能会使某些人感到不安。以下分析可能更为严格,因为它不会要求我们忽略选择顺序。

继续专注于你的球。它有一定的概率被选为第球。尽管易于计算,但我们不需要知道它的值:重要的是每个球的值必须相同(因为所有球都是等效的)并且它不为零。但是,如果它为零,则不会有任何球被选中:只要至少剩下一个球,。 k + 1 p k p k0pkk+1pkpk0

请再次注意颜色。 根据定义,将选择特定颜色的机会(在随机去除球之后)是所有原始色球的机会之和除以所有原始球的机会之和。当存在原本是颜色的球和球总量,该值是k C k C C nCkCkCCn

Prk(C)=kcpknpk=kcn.

当它不依赖于,QEDkk<nk


感谢您的评论。它帮助我更多地了解了基本流程!
mjnichol

2

给个球的分布-在已经替换了球之后,在给定此类分布的分布的情况下,具有类别分布。E D kD kkE(Dk)Dk

我猜你在问是否恒定。E(Dk)

我认为是这样。假设您最终画出了所有球。球的所有排列均可能。最初绘制的概率为。您可以将选择重新排列为同样可能的排列,最后选择第一个选择的球,第二个选择第一个的球。由于对称性,该球的期望值必须等于。通过归纳,全部相等。E D 1E D 0E D iE(D0)E(D1)E(D0)E(Di)


您的意思是我在问是否对每个k都是常数,对吗?E(Dk)
mjnichol

@mjnichol对
Neil G

0

“预期分布”不变。可以使用a论点!我将在稍后的答案中添加此类内容(我现在正在旅行)。

仅当您实际观察到抽奖时,以较早抽奖(为以后的抽奖)为条件的分布才会更改。如果您用紧紧的手从骨灰盒中拉出球,然后在不观察其颜色的情况下将其扔掉(我已经在课堂演示中有效地使用了这种剧院),则分配不会改变。这个事实有一个解释:概率是关于信息的,概率是一个信息概念。

因此,概率只有在获得新信息时才发生变化(即,条件概率)。拖拉球并在不观察的情况下将其扔掉不会给您任何新的信息,因此没有新的条件要处理。因此,当您以实际信息集为条件时,它并没有改变,因此条件分布无法改变。

 EDIT

我现在将不对这个答案提供更多细节,仅添加一个参考文献:Hosam M. Mahmoud:“Pólyan模型”(查普曼和霍尔),它像本问题中的那个一样对待模型,并且也更笼统地介绍了n方案,也可以通过使用ting方法获得极限结果。但是,本文中的问题不需要采用the方法。


即使您实际观察抽签,分配(对于以后的抽签)也不会更改。为什么观察什么会改变任何东西?
尼尔·G

1
@Neil我认为kjetil是指以观察到的抽奖为条件的分布。
银鱼2015年

@银鱼:嗯,我明白了。没错,我很抱歉。
Neil G

我将编辑,以便在两周内在家时更加清晰。现在就在威尼斯度假...
kjetil b halvorsen
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.