预期出生女孩与出生男孩的比例


45

我在求职面试能力测验中遇到了一个批判性思考的问题。它是这样的:

Zorganian Republic有一些非常奇怪的习俗。夫妻只希望生女,因为只有女才能继承家庭的财产,因此,如果有男生,他们将继续生更多的孩子,直到有了女孩。如果他们有一个女孩,他们就不再有孩子。在Zorgania,男女比例是多少?

我不同意问题作者给出的模型答案,该答案大约为1:1。有道理的是,任何出生都会有50%的机会成为男性或女性。

如果是该国的女孩人数,B是该国的男孩人数,您能否用数学上更强的答案说服我?GE[G]:E[B]G


3
您不同意模型答案是正确的,因为出生的M:F比率不同于孩子的M:F比率。在现实的人类社会中,只希望生女的夫妇很可能会采取杀婴或外国收养等方式摆脱男婴,导致男婴比例低于1:1。
加布2014年

10
@Gabe在这个问题中没有提到杀婴的问题,这是一种数学练习,而不是对一个常见的谋杀案发生地真实的国家进行严格的分析。同样,男孩与女孩的实际出生比例接近51:49(忽略社会因素)
理查德·廷格

2
多亏了这些答案,我现在才知道为什么该比例为1:1,这在我看来听起来很直观。我难以置信和困惑的原因之一是,我知道中国的乡村存在男女比例过高的相反问题。我可以看到,现实中的是,夫妻在获得所需性别之前将无法无限期继续生育。在中国,法律规定农村地区最多只能生育2个孩子,因此在这种情况下,这一比例将更接近于3:2而非1:1。
Mobius Pizza

4
@MobiusPizza:不,无论您有多少个孩子,比率都是1:1!中国拥有不同比例的原因是由于杀婴,选择性流产和外国收养等社会因素。
加布2014年

3
@newmount模拟虽然很好,但是它们的含义与内置的假设一样多。仅显示代码而没有任何解释,使人们很难识别这些假设。在缺乏某种理由和解释的情况下,此处没有任何模拟输出可以解决这个问题。就“现实世界”而言,提出这一主张的任何人都必须用有关人类出生的数据来支持它。
whuber

Answers:


46

从没有孩子开始

重复步骤

{

每对仍然有孩子的夫妇都有一个孩子。一半夫妻有男性,一半夫妻有女性。

那些有女性的夫妇不再生孩子

}

在每一步中,您得到的男女人数是偶数,并且有孩子的夫妇的数量减少了一半(即,有女性的夫妇在下一步将没有任何孩子)

因此,在任何给定时间,男性和女性的数量都是相等的,而且逐步生育子女的夫妇的数量减少了一半。随着创造更多的夫妻,同样的情况再次发生,并且在其他所有条件相同的情况下,人口中的男性和女性人数相同


6
我认为这是无需依赖严格的数学证明即可解释概率分布的绝佳方法。
LBushkin

1
我喜欢的是,这也可以解释您的直觉期望过剩的女孩发生了什么:过剩的女孩是父母(他们是再试一次的父母)所期望的,但是这些父母(总体上)从来没有成功地制造过剩的女孩。女孩。
本杰克逊

2
您可以说“重复步骤{某人决定是否要生一个孩子}”来进一步简化。只要每个人以相同的概率独立生产男孩和女孩,他们决定的规则就完全不相关。甚至不必假设该概率的值,您可以说人口中的频率与出生时的频率相同。
史蒂夫·杰索普

1
@martino我不相信这是事实,尽管如果有一些非常令人信服的数学方法对此效果我不会感到惊讶。我相信这种情况会导致我们对比率的概念崩溃,因为每个家庭的预期子女数是无限的。您应该对自己的回答持怀疑态度,因为人们对此话题的回答普遍。
jlimahaverford 2015年

1
@ martino。为了好玩,我只是使用该停止条件进行了模拟。10,000个家庭的男孩总数为160,693,469(这个数字加上10,000多的女孩),比率为0.9999377735896915。相当不可思议的东西。
jlimahaverford

37

令为家庭中男孩的数量。一旦有了一个女孩,他们就会停下来,所以X

X=0if the first child was a girlX=1if the first child was a boy and the second was a girlX=2if the first two children were boys and the third was a girland so on

如果是一个孩子是男孩的概率,并且性别在两个孩子之间是独立的,那么一个家庭最终拥有男孩的概率为 即生男孩然后生一个女孩的概率。男孩的预期人数是 注意我们得到 ķ PX = ķ = p ķ1 - p ķpk

P(X=k)=pk(1p),
kΣ ķ = 0 ķ p ķ = Σ ķ = 0ķ + 1 p ķ + 1
EX=k=0kpk(1p)=k=0kpkk=0kpk+1.
k=0kpk=k=0(k+1)pk+1
&Sigma;ķ = 0 pķ=1/1-p0<p<1
k=0kpkk=0kpk+1=k=0(k+1)pk+1k=0kpk+1=k=0pk+1=pk=0pk=p1p
当时 ,我们使用(请参见几何级数)。k=0pk=1/(1p)0<p<1

如果,则具有。也就是说,平均每个家庭有一个男孩。我们已经知道所有家庭都有1个女孩,所以随着时间的流逝,这个比例甚至是。ë X = 0.5 / 0.5 1 / 1 = 1p=1/2EX=0.5/0.51/1=1

随机变量被称为几何随机变量X


4
这当然,假设p是所有的家庭一样。相反,如果我们假设有些夫妻更有可能生男孩比别人(,它们p是更高),那么结果的变化,即使平均的值p仍是0.5。(不过,这是对基本统计数据的很好的解释。)
Ben Hocking 2014年

2
@Ben您的评论包含一个关键思想。我也发生了同样的事情,所以我编辑了我的问题,以包括对这种更现实情况的分析。它表明,限制比例是一定1:1。
whuber

1
@BenHocking的确!从现代统计数据和拉普拉斯对出生率的经典分析中我们都知道,并不真正等于。:)1 / 2p1/2
MånsT

21

摘要

所有出生独立有50%机会成为女孩的简单模型是不现实的,而且事实证明,这是例外。一旦我们考虑到人群中结果差异的后果,答案就是女孩与男孩的比率可以是不超过1:1的任何值。(实际上,它仍然可能接近1:1,但这是数据分析确定的问题。)

由于这两个相互矛盾的答案都是通过假设出生结局具有统计独立性而获得的,因此对独立性的呼吁不足以作出解释。因此看来,变异(以女性出生的机会为准)是悖论背后的关键思想。

介绍

当我们认为我们有充分的理由相信某事,但面对相反的扎实论证时,就会发生悖论。

令人满意的悖论解决方案有助于我们理解两种论点的对与错。就像概率和统计中的通常情况一样,这两个参数实际上都是有效的:解决方案取决于隐式做出的假设之间的差异。比较这些不同的假设可以帮助我们确定情况的哪些方面导致不同的答案。我认为,确定这些方面是我们最应该重视的。

假设条件

正如到目前为止发布的所有答案所证明的那样,很自然地假设女性出生是独立发生的,并且概率为。众所周知,这两个假设都不是真的,但似乎与这些假设的微小差异不会对答案产生太大影响。让我们看看。为此,请考虑以下更一般,更现实的模型:1/2

  1. 在每个家庭,无论出生顺序如何,女性生育的概率都是常数。p ipi

  2. 在没有任何制止规则的情况下,人口中预期的女性出生人数应接近预期的男性出生人数。

  3. 所有出生结局都是(统计上)独立的。

这仍然不是一个完全现实的人类出生模型,其中可能会随着父母(尤其是母亲)的年龄而变化。但是,它具有足够的现实性和灵活性,可以提供令人满意的悖论分辨率,甚至可以将其应用于更一般的模型。pi

分析

尽管对此模型进行全面分析很有趣,但要点也很明显,即使考虑到特定的,简单的(但有些极端)的版本。假设人口有个家庭。其中一半的女性生育几率是,另一半的女性生育几率是。这显然满足条件(2):预期的男女出生数相同。2 / 3 1 / 32N2/31/3

考虑那些最初的个家庭。让我们根据期望进行推理,了解实际结果将是随机的,因此与期望会有一些差异。(下面的分析背后的想法是在这篇文章的最后出现的原始答案中进行了更简短,更简单的传达。)N

令是具有恒定女性出生概率的人口中预期的女性出生数量。显然,这与成正比,因此可以写成。同样,令为预期的男性出生人数。f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • 的第一个家庭生一个女孩,然后停下来。其他个家庭生育一个男孩并继续生育孩子。到目前为止,这是女孩和男孩。pN(1p)NpN(1p)N

  • 其余个家庭的位置与以前相同:(1p)N独立性假设(3)表示,他们未来的经历不受长子是儿子这一事实的影响。因此,这些家庭将多产个女孩,多生个男孩。f(p)[(1p)N]m(p)[(1p)N]

将女孩和男孩的总数相加并与它们的和的假定值进行比较,得出方程f(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

与解决方案

f(p)=1  and  m(p)=1p1.

在前个家庭中,的预期女孩数为,而预期的男孩数量为。Np=2/3f(2/3)N=Nm(2/3)N=N/2

在第二个个家庭中,的预期女孩数为,而预期的男孩数量为。Np=1/3f(1/3)N=Nm(1/3)N=2N

总数为女孩和男孩。对于较大的,预期比率将接近预期比率,(1+1)N=2N(1/2+2)N=(5/2)NN

E(# girls# boys)2N(5/2)N=45.

停止规则有利于男孩!

更一般地说,对于一半的家庭,女孩的概率分别为,而另一半的男孩的概率为,则条件(1)至(3)继续适用,并且对于大的方法,预期比率p1pN

2p(1p)12p(1p).

根据(当然在到之间),该值可以在到之间(但不能大于)。仅当时,才达到最大值。换句话说,预期的女孩与男孩的比例为1:1是一个特殊的例外,这是更普遍和现实的规则,即与第一个女孩一起停止会有利于人口中更多的男孩。p010111p=1/2

解析度

如果您的直觉是停止与第一个女孩在一起应该会在人口中培养更多的男孩,那么您就是正确的,如此示例所示。为了正确起见,您所需要的只是在各个家庭中生一个女孩的几率有所不同(甚至只有一点点)。

“官方的”答案是比率应接近1:1,这需要几个不切实际的假设并且对它们很敏感:它假设家庭之间不能有差异,并且所有出生必须是独立的。

评论

该分析强调的关键思想是,人口内部的差异具有重要的后果。 出生独立性虽然是该线程中每个分析的简化假设,但不能解决这一矛盾,因为(取决于其他假设)它既与官方回答相反,又与之相反。

但是请注意,要使预期比率基本上偏离1:1,我们需要在总体中之间有很大的差异。如果所有在0.45至0.55之间,那么这种变化的影响将不会非常明显。要解决人口中实际上是什么的问题,需要一个相当大且准确的数据集。人们可能会使用广义线性混合模型并进行过度分散测试。pipipi

如果我们用其他一些遗传表达代替性别,那么我们就可以得到一个关于自然选择的简单统计解释:基于后代的遗传组成来差异地限制后代数量的规则可以系统地改变下一代中这些基因的比例。当该基因不具有性别关联时,即使很小的影响也将通过连续的世代繁殖并迅速放大。


原始答案

每个孩子都有一个出生顺序:第一胎,第二胎,等等。

假设男女出生的概率相等,而性别之间没有相关性,则弱势群体法则认为初生女性与男性的比例接近1:1 。出于同样的原因,第二胎女性与男性的比例接近1:1,依此类推。由于这些比例始终为1:1,因此总人口比例也必须为1:1,无论人口中出生顺序的相对频率如何。


有趣; 这似乎是因为,虽然没有规则可以改变自然比例的比例,但是可以改变结果子代的数量,并且子代的数量取决于自然比例。因此,在您的示例中,您有两个父母群体,他们受到的影响不同。(也就是说,这感觉像是在虚拟国家的暗示范围之外的情况,更像是数学练习)
理查德·廷格

@Richard可能只是因为为了说明起见,我过于简化了。实际上,将以的平均值为的分布来模拟总体。除非该分布的方差为零,否则相同的分析将得出相同的结论,包括预期的女孩与男孩的比率将严格小于。这表明普遍的结论(比率必须为1:1)主要取决于无差异假设。我不会为使用数学推理这一点而道歉,这不会减少结果的兴趣。pi1/21
whuber

1
您也不应该道歉,这是一个非常有趣的结果(我在阅读时确实想到了哇)。我只喜欢“原始结果”,“更现实的情况”的形式。它的书写方式感觉像是在作弊(这是不公平的,因为我说这很有趣),因为我可以很容易地说“显然不是1:1,因为男性出生更为普遍”(我相信由于我们的历史租约)死于武装冲突)
理查德·廷格

@Richard很好。我没有讨论这个问题的更现实的版本,例如将的平均值更改为约(顺便说一句,它与武装战斗无关:它具有生物学解释),因为该职位过长是,并且应该明确如何将其方法推广到该情况。我宁愿将重点放在解决悖论上,悖论正在寻找一种自然的(但可能被忽略)的机制,该机制阐明并解释了多个看似有效的答案之间的明显矛盾。pi0.51
whuber

@whuber感谢您提供的丰富答案。我不明白为什么在您的计算中,您将人口分成两个家庭,但她们生育女孩的可能性不同。根据模型假设的第1点,所有家庭的p_i应该相同。那么,为什么将人口分成两个家庭?
Mobius Pizza

14

每个孩子的出生都是一个独立的事件,男孩的P = 0.5,女孩的P = 0.5。其他细节(例如家庭决定)只会使您无视此事实。答案是比率为1:1

对此进行说明:想象一下,不是要生孩子,而是要掷一个公平的硬币(P(heads)= 0.5)直到获得“ heads”。假设A族掷硬币并获得[尾巴,尾巴,头]的顺序。然后,家庭B掷硬币并得到尾巴。现在,下一个成为正面人物的可能性是多少?仍为0.5,因为那是独立的意思。如果要对1000个族进行此操作(这意味着要抬起1000个头),则预期的总尾数为1000,因为每个翻转(事件)都是完全独立的。

有些东西不是独立的,例如一个家庭中的序列:序列[头,头]的概率为0,不等于[尾巴,尾巴](0.25)。但是由于问题并不是在问这个问题,所以这是无关紧要的。


3
如上所述,这是不正确的。如果性别是无条件独立的,从长远来看,家庭中出生时的女孩-女孩序列将与男孩-男孩序列一样多。后者有很多,而前者则从来没有。有独立的一种形式,但它是有条件的出生顺序。
whuber

1
@whuber我们不问有多少个女孩序列。只有女孩与男孩的比例。我没有说过单个母亲的出生顺序是一系列独立的事件,例如掷硬币。只有每个出生分别是独立的事件。
Tim S.

您将需要对此更加清楚。我提到了序列来证明缺乏独立性,因此您有责任在“独立性” 这个严格的意义上准确陈述。
whuber

@whuber事件与硬币翻转一样独立。我在回答中对此做了详细说明。
Tim S.

3
如果将所有分娩排成一行,则@whuber的女孩-女孩序列会出现;一对夫妇完成下一次进场等后
理查德·廷格2014年

6

想象一下,扔一个公平的硬币,直到观察到头部。你扔多少尾巴?

P(0 tails)=12,P(1 tail)=(12)2,P(2 tails)=(12)3,...

预期的尾数很容易计算*为1。

头数始终为1。

*如果您不清楚,请参阅此处的“证明概述”


6

仅有一个女孩而没有一个男孩的夫妇是最常见的

之所以能解决这个问题,是因为在这种情况下,女孩较多的可能性要比男孩较多的可能性大得多。而且有更多男孩的情况下概率很低。它自己运作的具体方式如下所示

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

您几乎可以看到此时的情况,女孩和男孩的总数加起来为1。

一对夫妇的预期男生 一对夫妇的预期男生=n=1(12n)=1
=n=1(n1n2)=1

Wolfram的极限解决方案

任何分娩,无论家庭成员,都有50:50的机会成为男孩或女孩

这一切都具有内在的意义,因为(无法尝试)夫妻无法控制特定出生是男孩还是女孩的可能性。一个孩子是由一对没有孩子的夫妇或一个有一百个男孩的家庭所生,都没有关系。机会是50:50,所以如果每个单独的出生都有50:50的机会,那么您应该总是得到一半的男孩和一半的女孩。而且,无论您如何改变家庭之间的出生关系,都没有关系。您不会影响到这一点。

这适用于任何1条规则

由于由于任何出生的可能性为50:50,因此您可以提出的任何(合理1)规则的比率最终将为1:1 。例如,下面的类似规则甚至可以解决

夫妻生一个女孩或生两个孩子时不再生育

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

在这种情况下,更容易计算出预期的孩子总数

一对夫妇的预期女孩 一对夫妇的预期男孩=0.51+0.251=0.75
=0.251+0.252=0.75

1如我所说,这适用于现实世界中可能存在的任何合理规则。一个不合理的规则是每对夫妇的预期孩子数是无限的。例如,“父母只有在男孩的男孩数量是女孩的两倍时才停止生育孩子”,我们可以使用与上述相同的方法来证明该规则为无限个孩子提供了:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

然后我们可以找到有有限个孩子的父母数量

预期有有限子女的父母人数=m=1(11/(3m)2)=π254=0.18277.

Wolfram的极限解决方案

因此,我们可以确定82%的父母有无限多个孩子。从城市规划的角度来看,这可能会引起困难,并表明这种情况在现实世界中不可能存在。


3
通过检查出生顺序可以明显看出出生不是独立的:女孩-女孩的序列从不出现,而男孩-男孩的序列则经常出现。
whuber

1
@whuber,我明白您的意思(尽管可以说,决定生育一个完全依赖的孩子,而不是事件本身的结果),也许最好说“未来生育男孩的可能性是独立的从过去的所有出生”
Richard Tingle 2014年

是的,我认为这里有一种方法可以挽救独立性的使用。但是,这-我认为-成为问题的核心,因此,为了满足OP对“激烈”(严格?)演示的要求,似乎需要对此​​问题进行一些仔细的推理。
whuber

@whuber老实说第一段是随波逐流的位,其他段(尤其是限制)应该是严格的位
Richard Tingle 2014年

无参数存在-但后者的材料已经被覆盖以同样的方式在回答stats.stackexchange.com/a/93833stats.stackexchange.com/a/93835stats.stackexchange.com/a/93841
whuber

5

您还可以使用模拟:

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio

1
仿真结果很好,因为它们可以给我们带来一些安慰,我们在数学推导中没有犯严重的错误,但与要求的严格演示相距甚远。特别是,当可能发生对期望有重大贡献的罕见事件时(例如,一个有20个男孩的家庭出现在一个女孩出现之前,这在仅10,000个家庭的模拟中就不太可能出现),那么模拟可能会变得不稳定或不稳定。甚至只是错误,无论它们迭代了多长时间。
whuber

认识家庭中男孩的几何分布是解决这个问题的关键步骤。试试:mean(rgeom(10000, 0.5))
AdamO

5

对此进行映射有助于我更好地了解出生人口的比例(假设为1:1)和儿童人口的比例都为1:1。虽然有些家庭会有多个男孩,但只有一个女孩,这最初使我认为男孩比女孩多,但这些家庭的数量不会超过50%,并且每增加一个孩子就会减少一半。单身家庭的数量将是50%。因此,男孩和女孩的数量将相互平衡。请参阅底部的总计175。 儿童比例


2

您得到的是最简单的答案。如果新生婴儿是男孩的概率是p,而不幸的事故没有遇到性别错误的孩子,那么父母是否根据孩子的性别决定是否生育更多孩子也没关系。如果孩子的数量为N并且N大,则可以预期大约p * N个男孩。无需进行更复杂的计算。

当然还有其他问题,例如“有孩子的家庭中最小的孩子是男孩的概率是多少”,或“有孩子的家庭中年龄最大的孩子是男孩的概率是多少”。(其中一个具有简单的正确答案,另一个具有简单的错误答案,要获得正确的答案很棘手)。


2

Ω={(G),(B,G),(B,B,G),}

作为样本空间,让

X: ΩRω|ω|-1

ωE(X)

E(X)=n=1(n-1)0.5n=1

琐碎地,女孩的期望值为1。因此比率也为1。


2

这是一个技巧问题。比例保持不变(1:1)。正确的答案是,它不会影响出生率,但会影响每个家庭的孩子数量,而每个家庭平均只能生育2个限制因素。

您可能会在逻辑测试中发现这种问题。答案与出生率无关。太分心了。

这不是概率问题,而是认知推理问题。即使您以1:1的比例回答,您仍然无法通过测试。


我最近编辑了我的答案,以表明解决方案不一定是1:1,这显然会颠覆您的主张。
whuber

我读了你的答案。您引入了一个问题中未提及的谓词(女性出生率的差异)。在这个问题上,没有任何东西可以断言Zorganian Republic是人类甚至人类的代表。
安德鲁-OpenGeoCode 2014年

1
没错-但是也没有什么可以证明所有出生概率都是相同的过分简化的假设是正确的。为了提供一个客观,可辩护的答案,必须进行假设,因此,至少要对它所作的假设给出明确的答案,并为这些假设提供支持。声称“这不是概率问题”并不能解决问题,而是完全忽略了它们。
whuber

@whuber-这个问题的出生率是不变的。问题的变体是每个家庭的出生人数。问题是分心,不是问题的一部分。<br/>横向思考是一种创造性思考的能力,或在业务中有时被称为“跳出框框”的能力,可以利用您的灵感和想象力从意外的角度看待问题,从而解决问题。横向思维包括抛弃显而易见的事物,抛弃传统的思维方式以及抛弃先入之见。[fyi>我是实验室的首席科学家]
安德鲁-OpenGeoCode 2014年

1
那么,您可能忽略了我的回答中的关键点:它的假设也使女性出生不变的人口平均机会保持为1:1(我希望可以明确描述这一特定方式)。我会坚持认为,在对任何悖论的解决方案中都涉及大量的“侧向思维”,在其中对假设进行了严格的检验:要想一开始就做出假设,就需要想象力和良好的分析能力。就像您在此处所做的那样,完全将任何问题都视为纯粹的“技巧”,这似乎与促进或赞扬这种思维是对立的。
whuber

2

我正在展示使用MATLAB软件为Monte Carlo模拟(500x1000系列)编写的代码。请仔细检查代码,以免出现错误。

结果生成并绘制在下面。它显示了模拟的女孩的出生概率与潜在的自然出生概率具有很好的一致性,而不管自然出生概率范围的终止规则如何。

在此处输入图片说明

玩弄代码可以更容易地理解我以前没有做过的一点-就像其他人指出的那样,停止规则是一种干扰。停止规则仅影响给定人口的家庭数量,或者从另一个角度来看给给定数量家庭的儿童出生数量。性别完全由掷骰子决定,因此比率或概率(与孩子的数量无关)将完全取决于自然的男孩:女孩的出生比例。

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])

2

ithXi0.5

E[iXi]=iE[Xi]=0.5nn

E[i(1Xi)]=iE[1Xi]=0.5n

出生的独立性与期望值的计算无关。


Apropos @whuber的回答是,如果整个家庭的边际概率有变化,则该比率向男孩倾斜,这是因为在男孩可能性较高的家庭中,比在概率较低的家庭中有更多的孩子,从而产生了增强效应。男孩的期望值总和。


2

在查看其他人所做的事情之前,我还单独在matlab中编写了一个仿真程序。严格来说,它不是MC,因为我只运行了一次实验。但是一次足以获得结果。这是我的模拟结果。我不赞成将出生概率设为p = 0.5作为原始变量。我让出生概率在Pr(Boys = 1)= 0.25:0.05:0.75的范围内变化。

我的结果表明,当概率偏离p = 0.5时,性别比与1:有所不同。在预期中,性别比只是男孩出生的概率与女孩出生的概率之比。也就是说,这是@månst先前标识的几何随机变量。我认为这就是原始海报的直觉。

我的结果非常类似于上述用matlab代码制作的海报所做的工作,将性别比例匹配为男孩出生的0.45、0.50和0.55概率。我介绍我的方法是因为我采用了稍有不同的方法来以更快的代码获得结果。为了完成比较,我省略了代码段vec = vec(randperm(s,N)),因为s未在其代码中定义,并且我也不知道此变量的初衷(该代码段似乎也是多余的-与最初一样)说)。

我发布我的代码

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

考虑到大量的强定律,预期下图。我复制了它,但是重要的图形是第二个图形。

在此处输入图片说明

在这里,孩子的性别出生概率为0.5以外的人口概率将改变总人口中的性别比。假设生育是独立的(但不是继续生育的选择),则在每一轮有条件生育中,人口概率决定着男孩和女孩生育结果的整体构成。因此,正如其他人所提到的那样,问题的制止规则与总体结果无关紧要,正如张贴者所指出的那样,即几何分布。

在此处输入图片说明

为了完整起见,制止规则所影响的是种群中的繁殖轮数。由于我只运行一次实验,因此图表有点锯齿。但是直觉是存在的:对于给定的人口规模,随着女孩出生的可能性增加,我们看到在整个人口停止生育之前,家庭需要较少的生育轮来获得所需的女孩(显然,生育轮数取决于人口规模,因为它机械地增加了一个家庭在生第一个女孩之前会有49个男孩的可能性)

在此处输入图片说明

我计算出的性别比之间的比较:

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

以及上一幅带有matlab代码的海报:

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

它们是等效的结果。


1

这取决于家庭的数量。

Xp=0.5

P(X=x)=0.5x,x=1,2,3...
E(X)=2

N

NXi

Xi/NE(X)=2N

TT=XiT

P(T=t)=CN1t10.5t,t=N,N+1...

E[NXi]=E[NT]=t=NNtCN1t10.5t=2F1(N,1,N+1,1)
2F1

2F1(N,1,N+1,1)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.