由于中央极限定理,有没有正态分布的变量不是*的示例?


11

在学习CLT之前,正态分布似乎是不直观的,这解释了为什么CLT在现实生活中如此普遍。但是,它是否曾经以一定数量的“自然”分布出现?


4
扩散的物理理论在某种程度上适用于任何系统,可以预测起源于某个点的量的正态分布(例如温度或浓度)。确实,许多系统具有扩散性(期权价格,均质介质中的粒子传输等),这表明例子很多,假设其中一个不那么天真地假设正态分布必须精确地支持不切实际的大或小值。 -这将是对所有物理理论的误解。
whuber

2
除非您了解正态分布在固定方差约束下使熵最大化,否则它似乎并不直观。
leonbloy

Answers:


11

在某种程度上,我认为这可能是一个统计问题,同时也是一个哲学问题。

许多自然现象是近似正态分布的。有人可能会争辩说,其根本原因可能类似于CLT:

  • 人们的身高可能被认为是许多较小原因的总和(也许是独立的,不可能完全相同地分布):各种骨骼的长度,各种基因表达的结果,多种饮食影响的结果或以上所有因素的某种组合。

  • 测试分数可以视为许多单个测试问题的分数总和(可能分布相同,不太可能完全独立)。

  • 粒子由于流体中的布朗运动而在一维中移动的距离:运动可以抽象地认为是分子的IID随机撞击导致的随机游动。

不一定涉及CLT的一个示例是围绕牛眼的镜头散布:距牛眼的距离可以建模为瑞利分布(与2 DF的chi-sq平方根成正比),从可以将正水平轴建模为均匀的然后,从极坐标更改为直角坐标后,水平(x)和垂直(y)上的距离变成不相关的双变量法线。[这是Box-Muller转换的本质您可以在Google上进行搜索。]但是,正常的x和y坐标可能被视为定位中许多小错误的总和,这可能证明背景中与CLT相关的机制是合理的。(0,2π).

从历史意义上讲,正态(高斯)分布而不是双指数(拉普拉斯)分布被广泛用于模拟天文观测,部分原因可能是由于CLT。在对此类观测结果进行建模错误的早期,高斯和拉普拉斯之间存在争论,他们各自争辩说自己喜欢的分布。由于各种原因,普通模型胜出了。可以说,正态分布最终成功的原因之一是基于CLT正态极限的数学便利性。即使不清楚哪个发行系列更合适,这似乎也是正确的。(即使现在,仍然有天文学家认为“最佳观察”由细心,受人尊敬的天文学家制造的望远镜,其价值肯定要比由观察家所提供的观察者所提供的许多观测结果的平均值高。实际上,他们不希望统计学家采取任何干预措施。)


是的 仍在修正错别字。感谢您注意到这一点。“测试分数”中的相同错误也已修复。
BruceET '19

-3

许多自然发生的变量呈正态分布。人类的高度?动物殖民地的大小?


1
@Happy实际上,这里给出的两个示例都不是正态分布的,因为正态分布的支持范围是-infinity到+ infinity,并且给出的示例永远不能为零或更少。在每种情况下,正态分布可能都是有用的近似值,但是如果您对分布的尾部感兴趣,则不是这样。
JeremyC

2
人类高度为(大约)独立基因的总和的结果,所以它们实际上由于CLT。
gardenhead '19

2
@ArtemMavrin:负高度将是8+标准偏差。如果一个对象正常近似不是有效的,因为它把零点概率密度超过8 SD的,你不妨也抱怨说,一个真正的正态分布值是不合理的概率为1,但我们所有的测量是有理数。
悬崖AB

1
@ArtemMavrin:好,如果问题是任何东西正是正态分布,那答案很简单:没有。甚至没有rnorm(1)。除多项式外,所有分布均相同。
悬崖AB

2
@gardenhead阅读了中心极限定理的陈述,并注意与您所说的不符的地方(基因数量是有限的,而CLT是关于标准化和的极限分布为。)顺便说一句,还有一个定理说,有限的iid非正态变量之和不能是正态;该定理与实际的CLT不矛盾!)n
Glen_b -Reinstate Monica
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.