我是由1300年出生的某个人继承而来的可能性有多大?


26

换句话说,基于以下内容,p是多少?

为了使这成为数学问题,而不是人类学或社会科学问题,并简化该问题,假定在整个人口中选择同伴的概率相同,除了兄弟姐妹和第一代表亲从未交配,并且总是从同一个中选择同伴代。

  • n1初始人口
  • g数代。
  • c每对夫妇的平均子女数。(如果需要答案,请假设每对夫妇的子女数完全相同。)
  • z没有孩子并且不被视为伴侣的人口百分比。
  • n 2 zn2人口。(应该给出或,(我认为)可以计算出另一个。)n2z
  • p最终一代中某人成为初始一代中特定人的后代的概率。

这些变量当然可以更改,省略或添加。为了简单起见,我假设和不会随时间变化。我意识到这将得到一个非常粗略的估计,但这是一个起点。cz

第2部分(建议进一步研究):

您如何认为未以全局一致的概率选择伴侣?实际上,伴侣更有可能具有相同的地理区域,社会经济背景,种族和宗教背景。如果不研究此问题的实际概率,这些因素的变量将如何发挥作用?这有多重要?


2
这是一个作业问题吗?否则,背景是什么?
David LeBauer 2011年

1
@John:感谢您的编辑。我相信(在此站点和其他站点上)普遍的共识是,我们编辑问题不只是添加homework标签。最好让所有相关人员都这样做。如果您尚未看到此元线程,可能会对它感兴趣。
主教

我只是好奇。我不是学生,也不是任何人的作业。我只是在开玩笑,因为我可以看到它暗示了家庭作业。
xpda 2011年

3
为了得到答案的初始意义上说,考虑到部分是人口没有通过血统与给定的祖先。最初,对于总体,。用随机混合,被平方每一代人之后。例如,在的初始种群中,这意味着在经过代(约至年)之后几乎肯定为。f = n 1 / n n f n = 10 8 f 0 32 600 800ff=(n1)/nnfn=108f032600800
Whuber

1
我相信有一些关于唯一姓氏消失的可能性的学术研究。尽管与提出的问题并不完全相同,但这可能会提供一些有趣的见解(但不幸的是,我不记得它的来源)。奇怪的是,我相信这些研究导致了对传染病传播背后的数学的一些洞察……
Michael McGowan

Answers:


13

因为这个问题收到的答案从天文小到几乎100%不等,所以我想提供一个模拟,以作为改进解决方案的参考和启发。

我称这些为“火焰图”。每个人都记录了遗传物质在种群中的离散分布,因为它们是离散世代繁殖的。这些图是描绘人的细小垂直段的阵列。每行代表一个世代,首个世代位于顶部。每一代的后代都在紧靠其下方的行中。

开始时,只有一个人口为被标记,并以红色标出。(很难看到,但是它们总是绘制在第一行的右边。)它们的直接后代同样用红色绘制;他们将出现在完全随机的位置。其他子孙被绘制为白色。由于人口数量在一代之间变化,因此右侧的灰色边框用于填充空白空间。n

这里是20个独立仿真结果的数组。

火焰图

红色遗传物质最终在这些模拟中的9个中消失了,其余11个(55%)留下了幸存者。(在一种情况下,最左下角似乎是整个人口最终都灭绝了。)尽管有幸存者,但几乎所有人口都含有红色遗传物质。这提供了证据,即从最后一个包含红色基因的人中随机选择一个个体的机会约为50%。

该模拟通过随机确定每一代开始时的生存率和平均出生率来进行。生存率来自Beta(6,2)分布:平均为75%。这个数字既反映了成年之前的死亡率,也反映了没有孩子的人的死亡率。出生率是根据Gamma(2.8,1)分布得出的,因此平均为2.8。结果是一个残酷的故事,即生殖能力不足以补偿普遍的高死亡率。它代表了一种极其悲观的,最坏的情况-但是,正如我在评论中所建议的那样,人口增长的能力并不是必需的。每一代重要的是人口中红色的比例

为了模拟繁殖,通过采集所需大小的简单随机样本,将当前种群减少到幸存者。这些幸存者是随机配对的(配对后剩下的任何奇怪的幸存者都无法繁殖)。每对产生一个从泊松分布中抽取的孩子,其平均值是该代人的出生率。如果父母双方中的任何一个包含红色标记,则所有孩子都继承红色标记:这将模拟通过父母双方直接后裔的想法。

本示例以512人口开始,并运行了11代(包括起点在内的12行)的模拟。此模拟的变体从到多达人,使用不同数量的和出生率,都表现出相似的特征:到代结束(在这种情况下为9),大约有1/3的可能性所有红色都消失了,但是如果没有,则大多数人口都是红色。在两到三代之内,几乎所有人口都是红色的,并将保持红色(否则人口将全部丧生)。2 14 = 16 384 日志2Ñ n=8214=16,384log2(n)

顺便说一句,一代人中75%或更少的幸存者并不幻想。在1347年末,感染了鼠疫的老鼠首先从亚洲进入了欧洲。在接下来的三年中,约有10%至5​​0%的欧洲人口因此丧生。鼠疫在几百年后的几代人中几乎都复发了一次(但通常没有相同的极端死亡率)。


模拟是使用Mathematica 8 创建的:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm

1
我认为这样的建模可能是最好的方法。(对我来说)这比数学简单得多,也更有趣,它应该使引入限制配偶选择的因素变得容易得多。在我深入探讨这个问题之前,您有任何建议,警告或其他建议吗?
xpda 2011年

3
@xpda数学解决方案将提供有关重要和不重要的见解。例如,它们将表明您不一定需要对大量人口进行建模。它们还将指示可变性所起的作用,可变性在分析上更难处理,并且在仿真中脱颖而出。
Whuber

1
@whuber您是否在Mathematica中运行了仿真?您介意发布代码吗?
假定正常的2012年

1
@Max现在代码到了。对于缺乏评论,我深表歉意。如果你运行的每一个randomPairsnext测试数据,其功能应该是显而易见的。注意使用NestList迭代next来产生多代。
ub

3

当您尝试计算祖先时会发生什么?

您有2个父母,4个祖父母,8个曾祖父母,...因此,如果您回溯代,那么您就有祖先。假设平均发电时间为年。自1300以来,大约有代人,那时我们大约有2.68亿祖先。2 n 25 28n2n2528

这是正确的球场,但是此计算存在问题,因为1300年的地球人口并没有统一混合,并且我们忽略了您祖先的“树”内的通婚,即我们在重复计算一些祖先。

尽管如此,我认为,通过将1300中的人口比例与人口总数的比值设为可以得出1300中随机选择的人是您祖先的概率的正确上限228


2
考虑到当时很多人口彼此隔离,这一点非常重要,因此避免通婚的机会要少得多。
dcl

2
因此,假设OP来自英国血统,大约1300年,英国人口超过一百万。(让我们在大饥荒之前说)。那将如何改变您的分析?
dassouki 2011年

228268 亿,而不是十亿。这是正确的球场。
Whuber

天哪!编辑答案。计算仍会忽略通婚,但是通过取分数或亿,这可能会为1300中随机选择的人是您祖先的概率提供正确的上限。228/34
vqv 2011年

2

您走得越远,您与一个成功传承了那个时代的基因的人的联系就越可能。在1300年中,您拥有的1/4亿祖先中,有许多人会在您的家谱中出现数百次(如果不是数千次,数百万次)。遗传漂移和我们与某人直接相关的次数可能比我们祖先的人与我们遗传密码的差异更相关。


0

概率为= 1-z,此问题中的每个后代都与上述祖先有关。最初的繁殖率是(1-z),是您从初始种群中某人后代的概率,只有不确定的概率是最终种群中活着的几率。

我同意埃拉德的回答,尽管我现在认为埃拉德回答了一个未曾提出的问题,即鉴于已知的前任生殖和人口限制,您还活着的概率是多少。


问题是要找到最后一代中某人从最初一代中的特定人后代的可能性。如果 = 3.6亿, = .2,那么在例如 = 1的情况下,概率就不会是1-。n1zzg
xpda 2011年

此外,为了澄清,问题是要找到的概率特定的人被下降最终生成一个特定的人在最初的一代。
xpda 2011年

1
@xpda这是一个奇怪的解释,因为每个人都是或不是来自某个特定个体,就像通过DNA测试所建立的那样。我认为许多人可能已经理解您的问题的方式是,如果我们在1300年选择一个任意的人“ ”,而今天又选择一个活着的随机人,那么他们从衍生出来的机会是多少?这可以通过估算派生的当今人口比例来回答。我们也可以将随机选择。AAAA
Whuber

@Wipa Descartes的cogito,ergo sum强烈暗示,鉴于我的
前额

@whuber,你是对的。我相信我们正在谈论同样的问题。我想澄清的是,我并不是在寻找第一代人后代还活着的可能性。我担心这就是Wipa提出(1-z)答案的地方。
xpda 2011年

0

我更新的简短答案是:

p>(1z)×1n1(1z)2=2n1

答案解释:
今天有一个特定的人,可以肯定的是他们是1300年至少 2个人的后裔。

在1300年选择某个特定人物时,该人物从未繁殖的可能性为(1-z),另一个术语是“父母伴侣”的数量,以及该人与这对情侣相关的概率(1 /夫妻数量)。

(1-z)最终被抵消,剩下

p>2n1

现在只是为了娱乐,但不是解决概率问题的必要条件。
这是从那时到今天之间链中任何给定世代k的总数。

nk+1=nk(1z)×c2=n1(1z)kck2k

让我们以一些数字为例。作为假设,我使用:
g = 28(1300年至2011年之间的25年世代)
n = 360M(维基百科上1300年的世界人口估计)
z = 0.2,c = 2.77 = 8(不是真实数据,但最终得出在2011年大约有7B个人)

结果: 或180M中的1分之一以上。

p>2/360,000,000=5.56×109

感谢您的阅读,埃拉德


什么是?是什么?žcz
mpiktas 2011年

基于上面的原始问题:c =每对夫妇的平均孩子数,z =没有孩子的人的百分比
Erad 2011年

2
嗯,您的概率为何小于 =?1 / 360 中号10 - 91/n1/360M109
mpiktas 2011年

3
360,000,000/(2.66×10249)1

1
108

0

这是一个非常有趣的问题,因为它要求我们在数学上求解分形。如著名的人生游戏

从开始,每一代与之相关的总体百分比将在每次迭代中增长p1=2n1limkpk=(1z)

如果我们将表示为代中某人与初始种群相关的概率。为简单起见,让我们放宽兄弟姐妹和堂兄弟的规则(可以稍后添加)。然后: k p 1 = 2pkk

p1=2n1

因为新一代的每个人在最初的人口中都只有 2个祖先。 在这种情况下,亲戚的计算公式为: 换句话说,同胞组合的数量乘以同胞家族的数量除以总的交配组合。

p2=relatives×2n2+non.relatives×4n2
relatives=(c2)×nc(n2)=c1n1
p3=immediate.relatives×4n3+cousins×6n3+non.relatives×8n3

对于每一代人来说,与最初人口中某人相关的可能性无疑会增加,但是速度会逐渐降低。这是因为绘制来自相同或相似树的“亲戚”的可能性将会增加。

让我们以种族为例。可以说,我们知道某人是100%高加索人。在第28代,他极有可能与1300年的高加索人口中的很大一部分有关(如@whuber模拟所示)。可以说他要嫁给一个拥有100%不同种族的人。他们的后代将被链接到大约1300人的两倍。

另一个有趣的想法是,鉴于人类(同型人)种族起源于非洲的约600人,那么我们很可能是所有成功交配的人的遗传排列。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.