您似乎在问题中假设正态分布的概念在确定分布之前就已经存在,人们试图找出正态分布的含义。我不清楚这将如何工作。[编辑:至少有一种感觉,我们可能会认为存在“寻找分布”,而不是“寻找描述了很多现象的分布”。
不是这种情况; 该分布在称为正态分布之前就已经知道。
您如何向这样的人证明所有正态分布数据的概率密度函数呈钟形
正态分布函数是通常具有“钟形”的东西-所有正态分布都具有相同的“形状”(就它们而言,仅在比例和位置上有所不同)。
数据在分布中看起来或多或少呈“钟形”,但这并不正常。许多非正态分布看起来类似“钟形”。
尽管有时是相当合理的近似值,但从中提取数据的实际总体分布可能永远不会是正态的。
对于我们应用于现实世界中的事物的几乎所有分布,通常都是如此-它们是模型,而不是关于世界的事实。[例如,如果我们做出某些假设(用于泊松过程的假设),我们可以推导泊松分布-一种广泛使用的分布。但是,这些假设是否曾经完全满足?通常,我们可以说的(在正确的情况下)最好的是它们几乎是正确的。
我们实际上认为正态分布的数据是什么?遵循正态分布或其他形式的概率模式的数据吗?
是的,要实际分布为正态分布,从中抽取样本的总体必须具有正态分布的确切函数形式的分布。结果,任何有限的人口都不可能是正常的。必定有界的变量不能是正态的(例如,特定任务花费的时间,特定事物的长度不能为负,因此它们实际上不能呈正态分布)。
可能更直观的是,正态分布数据的概率函数具有等腰三角形的形状
我不明白为什么这一定更直观。这当然更简单。
当最初开发误差分布模型(特别是早期的天文学)时,数学家考虑了各种与误差分布有关的形状(包括一个早期的三角形分布),但在许多工作中,它是数学的(宁可比直觉)。例如,拉普拉斯研究了双指数分布和正态分布(在其他分布图中)。相似地,高斯几乎同时使用数学来推导它,但是与拉普拉斯所考虑的因素不同。
从狭义上讲,拉普拉斯和高斯正在考虑“错误分布”,我们至少可以将其视为“寻找分布”。两者都假定了一些错误分布的属性,这些错误分布被认为是重要的(随着时间的推移,Laplace认为一系列标准有所不同)导致了不同的分布。
基本上我的问题是为什么正态分布概率密度函数具有钟形而不是其他形状?
事物的功能形式称为法线密度函数,就赋予了该形状。考虑标准法线(为简单起见;每个其他法线具有相同的形状,只是比例和位置有所不同):
fZ(z)=k⋅e−12z2;−∞<z<∞
(其中只是一个选择为使总面积为1的常数)k
这定义了每个值处的密度值,因此它完全描述了密度的形状。这个数学对象就是我们附加标签“正态分布”的东西。名字没有什么特别的。这只是我们附加到发行版的标签。它有很多名字(仍然被不同的人称为不同的事物)。x
尽管有些人认为正态分布某种程度上是“正常的”,但实际上,仅在特定情况下,您甚至倾向于将其视为近似值。
通常将分布的发现记入de Moivre(作为二项式的近似值)。实际上,当他尝试近似二项式系数(/二项式概率)以近似原本繁琐的计算时,他实际上推导了函数形式,但是-尽管他确实有效地推导了正态分布的形式,但他似乎并没有考虑到他的近似为概率分布,尽管有些作者确实建议他这样做。需要一定数量的解释,因此该解释存在差异的范围。
高斯和拉普拉斯在1800年代初就做了研究。高斯(Gauss)于1809年(与之相关的是均值是中心的MLE的分布)和拉普拉斯(Laplace)于1810年对此进行了描述,以近似对称随机变量之和的分布。十年后,拉普拉斯给出了中心极限定理的早期形式,用于离散变量和连续变量。
供配电早期名称包含错误的法律,在错误的频率的规律,也被两个拉普拉斯和高斯命名,有时联合。
1870年代的三位不同作者(皮尔士,雷克西斯和高尔顿)使用“正态”一词独立地描述了分布,第一位作者于1873年,另两位作者于1877年。距高斯和拉普拉斯(Laplace)的市盈率是de Moivre逼近以来的两倍以上。高尔顿对它的使用可能是最有影响力的,但他在1877年的那本书中仅使用了一次“正常”一词(通常称其为“偏差定律”)。
然而,在1880年代,高尔顿多次使用与分布相关的形容词“正态”(例如1889年的“正态曲线”),进而对英国后来的统计学家产生了很大的影响(尤其是卡尔·皮尔森) )。他没有说为什么用这种方式使用“正常”一词,但是大概是在“典型”或“通常”的意义上说的。
短语“正态分布”的第一个明确用法似乎是卡尔·皮尔森(Karl Pearson);他当然在1894年就使用过它,尽管他声称使用它已经很久了(我会谨慎考虑这一说法)。
参考文献:
米勒(Jeff Miller),
“一些数学词汇的最早已知用法:”
正态分布(约翰·奥尔德里奇的条目)
http://jeff560.tripod.com/n.html
Stahl,Saul(2006),
“正态分布的演变”,《
数学杂志》,第1卷。79,第2号(4月),第96-113页
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
正态分布,(2016年8月1日)。
在维基百科,免费百科全书中。
2016年8月3日12:02,从https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History检索
Hald,A(2007年),
“ De Moivre对二项式的正态近似,1733年及其推广”,载
于:从伯努利到费舍尔的参数统计推断的历史,1713-1935年;第17-24页
[您可能会注意到这些来源之间在其对德莫伊弗的解释方面存在重大差异]