我怎么能发现正态分布?


16

什么是正态分布的第一个推导,您能否重现该推导在其历史背景下进行解释

我的意思是,如果人类忘记了正态分布,那么我最有可能重新发现它的方式是什么,最可能的推导是什么?我猜想最初的推导一定是作为尝试寻找快速方法来计算基本离散概率分布(例如二项式)的副产品而来的。那是对的吗?


2
得出概率分布并不是很困难:采用任何正可积函数,对其进行归一化,这样您就有了概率密度。现在,如果要对一组分布进行基于似然的推断,则需要将密度的对数作为简单的凸函数。更准确地说,如果您希望最大可能性最小化给定的凸损耗函数,则此损耗的指数是密度的适当选择。平方误差产生正态分布,并且可能是凸损耗的最简单示例。
奥利维尔(Olivier)

1
@Olivier,仅因为您可以轻松地发明概率分布,并不意味着它有用或无处不在。高斯分布的发现与解决我猜想的实际问题有关,而不仅仅是标准化函数。
statslearner '18

2
已经有许多与此历史相关的问题和答案,可能回答或部分回答您的问题。
Glen_b-恢复莫妮卡

2
Wikipedia中有关历史记录的部分en.wikipedia.org/wiki/Normal_distribution#History值得阅读。我得出的结论是,这里的优先事项经常是国际争端的问题。您可以从De Moivre,Laplace,Gauss等城市中挑选……
mdewey

2
看看这里一个这个问题,并通过@Glen_b答案stats.stackexchange.com/questions/227034/...我想的是如何的一种方式,你也许会重新发现正态分布是进行测量,实现有关联的不确定性/错误进行测量,即如果您重复测量一次又一次,结果将不会100%相同。然后,您要量化不确定性/误差。然后,您需要进行演算:)同样,Stahl参考也确实值得一读!
斯特凡

Answers:


7

我猜想最初的推导一定是作为尝试寻找快速方法来计算基本离散概率分布(例如二项式)的副产品而来的。那是对的吗?

是。

正态曲线由DeMoivre在1733年以数学方式开发,以近似二项式分布。直到1924年,卡尔·皮尔森才发现了他的论文。拉普拉斯(Laplace)在1783年使用正态曲线来描述误差的分布。随后,高斯在1809年使用正态曲线分析了天文数据。

资料来源:正态分布

具有历史背景的其他来源:

如今,正态分布是大二项式近似值这一事实被视为中心极限定理的特例。在大多数教科书中都可以找到它,并且被认为是基础知识。您可以在Wikipedia上找到证明。指数只是显示为e x = lim 1 + xn后的特性函数的一些泰勒展开成品率-2ex=lim(1+xn)n。有时,您仍然在教科书中找到二项式的特殊证明,这就是DeMoivre-Laplace定理。t22


Benoit,DeMoivre的派生似乎并不简单,您能否在答案中包括它?我正在寻找这种DeMoivre推导(作为旁注,您是否知道所有的微积分和近似结果(例如,斯特林近似)已经为DeMoivre提供,还是这是他证明的现代版本?)
statslearner

1
这是一个现代版本。我不知道DeMoire的历史渊源。我仅有的历史信息是斯蒂芬和我所指向的文章。
Benoit Sanchez

6

Stahl(《正态分布的演变》,《数学杂志》,2006年)认为,正态的最早历史痕迹来自赌博,对二项分布的近似(针对人口统计学)以及天文学中的误差分析。


4
是的,但是在大多数(全部?)情况下,正态分布并不明确。这听起来有点像结论本·富兰克林(Ben Franklin)知道(或发明了)麦克斯韦方程式,因为他进行了电学实验。
ub

您能提供这些作者所做的推导吗?
statslearner

例如,他们需要什么数学来推导它?
statslearner

3

问题的历史部分已在此论坛上被回答了多次,例如,查看已接受的答案类似问题。不,没有发现它是离散分布的近似值。我怀疑当时是否存在概率分布的概念。这是由当今被称为物理学家或数学家的人们发现的,我想当时是自然哲学家。

另一个文明如何发现正态分布是一个有趣的问题。研究任何类型的错误和干扰的任何人都将找到它。它的发生使我们的文明在研究天体时发现了它。我怀疑其他人可能会在物理学或数学之前发展统计学。


2

我也问自己这个问题,这个youtube影片是我找到的最佳答案

https://www.youtube.com/watch?v=cTyPuZ9-JZ0

我不认为这是原始的推论,但是视频的描述说:“这个论点是根据1850年的天文学家John Herschel和1860年的物理学家James Clerk Maxwell的著作改编而成的。”



1

It's hard to parse this question. Who is the "I" in this question? And when is the time in question? An almost trivial answer is finding a location/scale family that is exp(x2)。OP随后问:“如果人类忘记了正态分布,将以什么方式重新发现它?”?这是一个完全不同的问题。我认为这里的一个相关答案是:1)借用现代科学的观点2)提供的答案不同于最经常遇到的历史答案,也就是中央极限理论。

在量子力学,信息论和热力学中,熵量化了系统的状态。在这些领域中,量子态实际上是完全随机的或随机的。将此与经典力学进行对比。在经典力学中,状态是固定的,但是由于成百上千万的未观察到的影响因素的影响,我们的观察是不完善的:这种结果产生了CLT。

在量子力学中,我们使用贝叶斯概率来量化我们对系统状态的信念。沿着这些思路,我们提出并证明了高斯或正常随机变量在所有具有有限均值或标准差的随机变量中具有最大熵。

https://www.dsprelated.com/freebooks/sasp/Maximum_Entropy_Property_Gaussian.html

https://en.wikipedia.org/wiki/Differential_entropy

http://bayes.wustl.edu/etj/articles/brandeis.pdf

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.