鉴于今天是a日,有人知道know日出生的可能性吗?
鉴于今天是a日,有人知道know日出生的可能性吗?
Answers:
当然。请参阅此处以获取更详细的说明:http : //www.public.iastate.edu/~mlamias/LeapYear.pdf。
但从本质上来说,作者得出这样的结论:“在2千年中有485个leap年。因此,在2千年中,共有天。其中,2月29日发生在其中有485个(the年),因此概率为 “
要使用统计数据准确预测该概率,了解出生地点将很有帮助。
此页面http://chmullig.com/2012/06/births-by-day-of-year/上的图表显示了每天出生数的子集(将29乘以4),这是不正确的,也是不受欢迎的这个问题,但它也链接到原始数据,并在美国提供了大致说明。我认为,这条曲线对其他国家(尤其是其他大洲)不适用。特别是在假设气候是决定因素的情况下,南半球和赤道地区可能显示出这些结果的实质性推论。
此外,还有“择优出生”的问题(由http://bmjopen.bmj.com/content/3/8/e002920.full的作者触及)-在世界上较贫穷的地区,我希望情况有所不同出生分布,仅仅是因为(非紧急情况下)剖宫产或人工分娩比发达国家少。这歪曲了出生的最终分布。
使用美国的数据,假设2月29日有约7100万出生(粗略的均值* 366)和46.000例出生,由于数据中未显示准确的时间段,因此未对correct年的分布进行校正,因此我得出了大约〜0.000648。这略低于给定的婴儿出生分布所期望的值,因此与图表给出的总体印象一致。
我将把这个粗略估计的重要性测试留给有动力的读者。但是,即使对于已经很低的2月标准,第29个(尽管未校正-2000年向数据中注入了低于平均水平的偏见)得分也很低,我认为相对较高的置信度可以拒绝均分布的零假设。
我认为这个问题的答案只能凭经验得出。如果不考虑生日选择现象,季节性等因素,任何理论上的答案都是有缺陷的。这些事情在理论上是不可能处理的。
由于隐私原因,在美国很难找到生日数据。有一个匿名的数据集在这里。它来自美国的保险申请。与其他报告(例如,经常被引用的NYT文章)不同的是,它按日期列出了出生频率,而不是简单地对一年中的天数进行排名。弱点当然是抽样偏差,因为它来自保险:未包括保险的人等。
根据数据,2月29日有325例出生,总共481040例。根据Roy Murphy的数据,样本跨度为1981年至1994年。其中包括3个leap年,总计14岁。如果不进行任何调整,则在1981年至1994年2月29日出生的概率为0.0675%。
您可以通过考虑闰年的频率,这是接近1/4(调整概率不完全虽然),例如,通过本数乘以到达至0.079%的估计。这里,条件概率p的在闰年出生年02月29链接到所观察到的频率˚F ø = 325由频率˚F 大号 = 3的闰年的样品中: ˚F ø = ˚F 大号/ Ñ ⋅ ˚F ⋅ p , 其中N = 14
通常情况下,闰年的概率为,因此,从长远来看,平均概率P 大号的出生年02月29是: P 大号 = p 大号 ⋅ p ≈ p 大号 ⋅ Ñ
鉴于您出生于leap年,因此您可能会对2月29日出生的条件概率感兴趣: p = N
因此,和p之间的联系基于一些假设,例如,在任何给定年份出生的概率是均匀的,并且不会改变。
当然,这种讨论是以美国为中心的。谁知道其他国家的模式。
更新:我们自动假定OP为公历。如果您考虑不同的日历(例如农历Hijri),它将变得更加有趣,其中the年大约每30年一次。
更新2:
Amitabh Chandra, Harvard University
现在,公历中最奇特的日子:作为最受欢迎的生日,1月1日,12月25日和Deb 29日将是随机出现的可能性有多大?我说随机发生的可能性很小。因此,更有趣的是看看Hijri等其他日历中发生了什么。
更新3:
更新4:
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
输出:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
我最喜欢的书的封面曾经提供一些高度相关的证据,以反对对出生日期和日期进行统一分配的假设。具体而言,自1970年以来,美国的生育率呈现出相互叠加的多种趋势:长期,数十年趋势,非周期性趋势,周日趋势,年日趋势,假期趋势(因为诸如剖宫产术部分可以有效地安排生日,而医生通常不在节假日安排生日。结果是,一年中随机选择的一天出生的可能性不一致,并且由于出生率在各年之间有所不同,因此并非所有年份都有相同的可能性。
这也提供了证据,证明Asksal的解决方案虽然是强有力的竞争者,但也不完整。少数leap日将被此处的所有作用“污染”,因此Asksal的估算也(相当偶然地)捕捉了当日和长期趋势以及 2月29日的影响。影响。您的问题并未明确定义哪些影响适合和不适合包含。
而且这种分析只对美国有影响,美国的人口趋势可能与其他国家或人口大不相同。例如,日本的出生率几十年来一直在下降。中国的出生率受到国家的监管,这对其国家的性别构成及其后代的出生率都有一定的影响。
同样,盖尔曼(Gelman)的分析仅描述了最近几十年,并且不一定清楚这甚至是您所关注的时代。
对于那些对这种事情感到兴奋的人,封面中的材料将在关于高斯过程的章节中详细讨论。
2月29日是每年发生的日期,是4的倍数。
但是,不是100的倍数但不是400的倍数的年份不被视为leap年(例如:1900不是is年,而2000或1600是are年)。因此,如今,每400年都是相同的模式。
因此,让我们以[0; 400 [间隔] 进行数学计算:
在400年的时间里,正好是4 x 25 = 100年,是4的倍数。但是我们必须从100中减去3(100的倍数,而不是400的倍数),我们得到100-3 = 97年。
现在我们要乘97 366,97 X 366 = 35502(闰年天在400年时期的数量),它仍然是(365×(400-97))= 110 595(即AREN天数” t在400年的year年内)。
然后,我们只需将这两个数字相加即可知道400年内的总天数:110 595 + 35502 = 146 097。
最后,我们的概率是400年内2月29日的数量,因此,假设有97个leap年除以我们间隔的总天数,则为97:
p = 97/146097≈0,0006639424492
希望这是正确的。
我注意到上面的大多数答案都是通过计算特定时期的leap日数来解决的。根据定义,有一种更简单的方法可以准确地100%得到答案:
我们使用leap年将常规(365天)日历调整为平均热带年(又称平均太阳年)。平均热带年份“是从地球上看,太阳在季节周期中返回到相同位置所花费的时间”(维基百科)。热带年份略有不同,但平均(平均)热带年份约为365.24667。
如果out日是正确的,则随机选择的一天为a日的机会是((热带年份)-(非-年))/热带年份
插入大约的数字,即(365.24667-365)/365.24667,或0.24667 / 365.24667,或每百万675(0.0675%)。
但是,这是随机选择的一天。我想这是父母所不愿意的,他们宁愿不必向孩子们解释:“您的实际生日每4年才来一次”。