一个相反的生日问题:100万外国人中没有一对人有一个生日。他们的年长是多少?


11

假设一个行星的天非常长。一个房间里有一个聚会,有100万外国人,而且根本没有一个人过生日。关于的大小可以推断出什么?ññ

(这个更紧凑的问题取代了措辞不佳的问题


生日问题告诉您N的值,其中至少一个匹配的概率大于指定值。当p = 1/2时,凭直觉出人意料的是n = 23。这假设每个生日都有相同的统一概率(1/365)。非均匀性只会使n变小。现在,在您的问题中,似乎N替换了365,并且我假设保持一致性假设。
Michael R. Chernick

如果N <= 1,000,000,则至少1个匹配的概率为1,因此0个匹配的概率为= 0。
Michael R. Chernick

因此,当N> 1,000,000时,至少1个匹配项的概率具有<1的概率,因此零匹配项的概率开始增加。
Michael R. Chernick

5
@Michael请为提出澄清要求和其他附带讨论保留意见,并尝试一次仅发表一个:限制字符数是有充分理由的。如果您发现自己在讨论一些需要多条评论的实质性内容,则可能是在尝试回答问题,所以您最好发布答案。
ub

Answers:


13

假设所有生日的可能性均等且生日是独立的,则外星人不共享生日的机会为ķ+1个

pķ;ñ=1个1个-1个ñ1个-2ñ1个-ķñ

如果远小于N,则它的对数可以渐近求和:ķñ

(1)日志pķ;ñ=-ķķ+1个2ñ-ķ+3ķ2+2ķ312ñ2-Øķ4ñ-3

确信Ñ大于某个值不低于Ñ *,我们需要1 为大于日志1 - α 。小α确保Ñ远大于ķ,从那里我们可近似1 精确地为- ķ 2 /2 Ñ 。这产生100-100αññ1个日志1个-ααñķ1个-ķ2/2ñ

-ķ22ñ>日志1个-α

暗示

(2)N>k22log(1α)k22α=N

对于小α

例如,对于如在问题和α = 0.05(对应于常规值95 的置信度), 2 给出Ñ > 10 13k=1061α=0.0595%(2)N>1013

这是对该结果的更广泛的解释。在不近似于公式,我们获得N 9.74786 × 10 12。对于这种Ñ在一百万的生日没有碰撞的几率p 10 6 - 1 9.74786 × 10 12= 95.0000 ... (无近似计算的),基本上等于我们的阈值95 。因此,对于任何一个如此大或更大的N,95 (2N=9.74786×1012ñp(1061,9.74786×1012)=95.000095ñ95或者更可能会出现没有冲突,这与我们所知道的是一致的,但对于任何较小碰撞的机会获得上述100 - 95 = 5 ,这开始让我们担心的是我们可能低估ññ100-95=5ñ

再举一个例子,在传统的生日问题中,k = 6个人中没有碰撞的可能性为k = 7个人中没有碰撞的可能性为5.6 。这些数字表明N应该分别在正确值366的范围内超过360490。这表明即使很小的k(假设我们坚持小α),这些近似的渐近结果也可以达到多么精确的精度。4ķ=65.6ķ=7ñ360490366ķα


我不准备给出这样的答案。使用数字,这种大的近似值可能更容易计算。Wikipedia给出了广义的生日问题,该问题显示了N人与k个人(外星人)的近似值和范围。我的公式与您的第一个公式相同。
Michael R. Chernick

我的问题是,要达到100%的置信度,N必须有多大。我认为大约是10 ^ 18。
Michael R. Chernick

1
@MichaelChernick对于100%的置信度N等于无穷大。对于任何有限的一年,与2个人以上组团任何一方,两名外国人与生日相同的概率总是大于0
佩雷

1
@Pere是的,谢谢您的发现。我会马上修复。这对其余职位没有影响。
whuber

2
@Paul Uszak我认为您对Pere的回答(现在已删除)的评论太苛刻了。我认为他的回答是真诚的。他试图通过提供有用的近似值来为您提供帮助。后来他看到了胡布的答案,并决定答案更加完整,并同意删除他的答案。他关于不希望得到详细答案的评论并不意味着您解释它的方式。这是一个难题。您甚至不得不重写帖子以使其易于理解。我相信他不会像开玩笑那样解决这样的问题。
Michael R. Chernick
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.