函数在统计中的重要性是什么?


19

在我的微积分课上,我们遇到了函数或“钟形曲线”,并被告知该函数在统计中有广泛的应用。ex2

出于好奇,我想问:函数在统计中真的很重要吗?如果是这样,那么使有用的原因是什么,它的一些应用是什么?ex2ex2

我在互联网上找不到有关此功能的太多信息,但是经过一些研究,我发现钟形曲线通常与正态分布之间存在联系。一个维基百科页面链接这些类型的功能,统计应用,由我强调,各国:

“正态分布被认为是统计中最突出的概率分布。其原因如下:1首先,正态分布由中心极限定理产生,该极限定理指出,在温和条件下,抽取了大量随机变量的总和不论原始分布的形式如何,来自同一分布的近似正态分布。”

因此,如果我从某种调查等中收集了大量数据,它们可以在类的函数之间平均分配。函数是对称的,对称性也就是对称的,即它对正态分布的有用性,是什么使它在统计中如此有用?我只是在推测。ex2

通常,什么使在统计中有用?如果正态分布是唯一的区域,那么是什么使在正态分布的其他高斯类型函数中唯一或特别有用?ex2ex2


首先,应该读为“平均”而不是“和”。
特里斯坦(Tristan)2012年

2
总和也是。毕竟,它只是平均值乘以样本数。
埃里克(Erik)

1
引文显示搜索关键词包括“正态分布”。在此执行搜索可以找到600多个线程-自该站点启动以来平均每天有一个线程。短时间仔细阅读这些命中点将很快帮助任何人理解“钟形曲线”在统计中的作用。
whuber

4
与正态分布相关最高评价的线程中得出结论:“每个人都相信误差的指数定律[即正态分布]:实验者,因为他们认为可以通过数学证明;而数学家,因为他们认为可以证明是通过观察确定的。”
whuber

查看回答我的问题“什么是高斯分布的最令人惊讶的特性” stats.stackexchange.com/questions/4364/...
罗宾·吉拉德

Answers:


12

该函数很重要的原因确实是正态分布及其紧密联系的伴奏,即中心极限定理(我们在其他问题中对CLT有一些很好的解释)。

在统计中,CLT通常可用于近似计算概率,从而使诸如“我们对95%的信心...”这样的陈述成为可能(“ 95%的信心”的含义常常被误解,但这是另一回事)。

函数是(经缩放的版本)的正态分布的密度函数。如果可以使用正态分布对随机量进行建模,则此函数描述该量的不同可能值的可能性。高密度区域的结果比低密度区域的结果更有可能。exp((xμ)22σ2)

σ是确定密度函数的位置和比例的参数。它与 μ对称,因此更改 μ意味着您将函数向右或向左移动。σ确定密度函数的最大值( x = μ),以及 x μ移开时它变为0的速度。从这个意义上讲,更改 σ会更改函数的范围。μσμμσx=μxμσ

对于特定选择,σ = 1 / μ=0密度是(与e - x 2成正比)。这些参数并不是特别有趣的选择,但是它的好处是产生的密度函数看上去比所有其他函数都简单一些。σ=1/2ex2

在另一方面,我们可以从去由变化变量的对任何其他正常密度X = û - μex2。你的教科书说,究其原因ë-X2,而不是EXP- X-μ2x=uμ2σex2,是一个非常重要的功能是,ë-X2是简单写。exp((xμ)22σ2)ex2


1
(+1)首先倒数第二段的一句话:我会说是成正比的地方
红衣主教2012年

@cardinal:谢谢,您说得对!我编辑了答案。
MånsT

1
+1,我真的很喜欢这个答案。可能需要指出的一件事是,法线的pdf通常写为在前面。原因是曲线下的总面积等于12πσ2,但由于典型的使用PDF的是确定的概率(其总和为1),它是方便的曲线下到等于1的区域,因此,我们通过总分裂以实现该结果。我认为您是对的,因为它外观更简单,因此已被省略。2πσ2
gung-恢复莫妮卡

3

你说得对,正态分布或高斯是缩放和移动,这样的重要性,EXP - X 2从事实,即它在本质上是正态分布来居多。exp(x2)exp(x2)

正态分布很重要,主要是因为(“在适度的规律性条件下”)当“许多”接近无穷大时,许多独立且分布均匀的随机变量的总和接近正态。

并非所有内容都是正态分布的。例如,您的调查结果可能并非如此,至少是如果回答甚至不是连续的,而是整数1-5。但是结果的均值通常分布在重复采样中,因为均值只是按比例缩放(归一化)的总和,并且各个响应彼此独立。当然,假设样本足够大,因为严格来说,仅当样本的大小变得无限大时,常态才会出现。

从示例中可以看到,即使数据不是正态分布,也可能由于估计或建模过程而出现正态分布。因此,统计数据中到处都有正态分布。在贝叶斯统计中,参数的许多后验分布近似为正态分布,或可以假定为正态分布。


回复:“正态分布或高斯是定标和移位的exp(-x ^ 2),因此exp(-x ^ 2)的重要性主要来自于它实际上是正态分布的事实。” - 正态分布的概率密度是一个高斯函数。正态分布本身并不等于,这似乎表明了这一点。ex2
2012年

他们不是同义词,感谢您指出这一点。(我的意图不是很精确,只是非统计学家可以理解。已经有了一个很好的精确答案。)
scellus 2012年

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.