在教授统计学时,使用“正常”还是“高斯”?


42

我在书中主要使用“高斯分布”,但有人建议我改用“正态分布”。对于初学者使用哪个术语有任何共识?

当然,这两个术语是同义词,因此这不是关于实质的问题,而纯粹是哪个术语更常用。当然,我同时使用这两个术语。但是,最应该使用哪个?


1
本书的预览部分/示例章节是否在某处可用?我听到了好消息。
Glen_b 2014年

2
@Glen_b amazon.com的“查找范围”功能可让您预览图书。另外,这里提供了三章:直观的
生物统计学.com / excerpts

6
“这个术语的问题比较常用的”很容易被解决,虽然粗制滥造:谷歌搜索“高斯”分布的有关于搜索的命中2/3“正态分布”。在Google学术搜索中,该比率略有不同,现在“高斯分布”的点击率是“正态分布”的一半(但排除“逆”时只有四分之一)。这些结果表明(1)“正常”更为流行,但(2)“高斯”被广泛认可。查看结果表明,“渐近正常”等短语可能需要很长时间才能被替换。
ub

2
在@whuber的扩展中,我认为各领域之间也存在差异:“高斯”似乎在科学中相对更占优势,而“正常”似乎是社会科学中的正常术语……
abaumann 2014年

1
尝试“异常”:P
Mehrdad 2014年

Answers:


47

即使我倾向于说“正常”的频率更高(因为这是我初学时所教的内容),但我认为“高斯”是一个更好的选择,只要学生/读者对这两个术语都非常熟悉:

  • 正常不是特别典型,因此名称本身具有误导性。它当然起着重要的作用(尤其是由于CLT),但是观察到的数据(特别是在高斯附近)的频率要比有时建议的要少得多。

  • 单词(以及诸如“ normalize”之类的关联单词)具有在统计中可能相关的几种含义(例如,考虑“正交基础”)。如果有人说“我对样本进行了归一化”,则无法确定它们是否已转换为正态性,计算出的z分数,将向量缩放为单位长度,长度为或其他多种可能性。如果我们倾向于将分布称为“高斯”分布,则至少第一个选择被消除,而更具描述性的替代它。n

  • 高斯至少对分配有合理的要求。


3
+1表示“只要学生/读者对这两个术语都非常熟悉”。我认为教“高斯” 对学生是无益的,因为“正常”是如此普遍。
Patrick Coulombe 2014年

6
我同意我们必须同时教这两个。如果我们从头开始,并且知道我们现在所知道的,我们将永远不会允许“正常”出现,因为(1)该术语以任何方式超载(2)正常(高斯)不是正常的(正常或预期的)数据的。即使在高斯之前有一段历史,“高斯”也是最常见的选择。ET杰恩斯(ET Jaynes)提出了“中央”的概念,这是一个愚蠢的想法,但尚未流行。(我认识到基于中心极限定理的论点。)
Nick Cox

关于项目符号2,当涉及到更广泛的科学和数学整体时,并不确定“ 普通 ”还是“ 高斯 ”是否更普遍。;-)
红衣主教

@cardinal-我完全同意这样的建议,即在那些领域它倾向于更多地倾向于“高斯”-我也将添加工程技术。
Glen_b 2014年

1
@Glen_b:同意。(在我的心智模型中,我将工程包括在科学的总括范围内,尽管那也许有点超出规范了。):-)
红衣主教

36

我会用高斯。

人们学习统计数据时面临的一个问题是,我们使用日常英语单词来表示不同的事物(能力,重要性,分布等)。在一定程度上,我们应该做到这一点。“正常”已经有很多含义。


2
彼得:我同意。这就是为什么我一直使用“高斯”的原因。但是,审阅者对新版(简洁版)的评论强烈推翻了“正常版”。
Harvey Motulsky 2014年

25

支持正态的一个论点是根深蒂固的表示法,其中代表“正态”。我还没有看到有人提议将其更改为。Ñ ģ μ σ 2N(μ,σ2)NG(μ,σ2)


1
Γ ģ 一个ü 小号小号ģ 一个ü 小号小号一个Ñ ë ř Ñ Ò ù b Ñ ø b Ñ ø ÑG可能也与Gamma冲突,应将其表示为但不幸的是,这是由同名函数使用的。另一种可能是或,这也将是一致和频繁abbrevation到。但是我实际上喜欢表示法,因为我经常写它,这是容易写的字母。ΓGaussGaussianBernoullibinomialbinomN
shadowtalker 2014年

这是一个公平的观点,尽管如果同时显示两个术语,则可以引入的用法。N
Glen_b 2014年

8
让 ;-)GN(μ,σ2)
史蒂芬·洛朗

1
@StéphaneLaurent:我想我的意思是,如果您避免使用“ normal”一词,学生可能会很难记住含义,因为它不再是助记符。N(μ,σ2)
Nate Eldredge 2014年

10

在德语中,它通常被称为GaußscheNormalverteilung,因此几乎不可能轻易地发生冲突。

高斯法线相结合是否合适?


8
也许gnormal会用英语!
Dilip Sarwate 2014年

2
@DilipSarwate𝅘𝅥𝅮我是gnormal,agnother gnormal𝅘𝅥𝅮(道歉弗兰德先生和斯旺)
霍布斯

9

根据Wolfram百科全书

尽管统计学家和数学家统一使用“正态分布”这一术语来表示这种分布,但物理学家有时将其称为高斯分布,并且由于其呈弧形张开的形状,社会科学家将其称为“钟形曲线”。

我同意“正常”更容易混淆-但我怀疑统计资料书通常使用“正常”。


+1为描述性而非说明性答案。我实际上同意其他答案,即无论在哪个领域,高斯都是可取的,但是从现有用法中广泛使用的上下文开始是有益的。
R..

至于“钟形曲线”一词,我会在任何教学环境中完全避免。由于同名的那本臭名昭著的书,它具有极高的种族主义色彩,您的任何意识到它的学生都可能被它分散注意力,并将您所说的一切与关于种族优越性的荒谬理论联系起来,而不是主题独立存在。
R.,

描述性的,是的,但是该描述与此处的答案直接矛盾,这表明统计学家和数学家中有很大一部分实际上使用了“高斯”一词。
David Richerby 2014年

使用术语“钟形曲线”表示高斯/正态分布(的密度函数)的另一个原因是,存在许多概率密度函数(pdf)类似于钟形曲线的分布。甚至Cauchy分布的pdf也看起来像钟形曲线!
Mico 2014年

+1用于解释不同学科中的相对术语。谢谢!
发烧友

7

我想指出的是,S。Stigler使用正态/高斯/拉普拉斯-高斯分布来证明“斯蒂格勒同名定律”发表在《统计表》上(有些页面可在books.google上找到)。

与这个问题特别相关且有趣的是,在第287-288页上,有“正常”对“高斯”对“拉普拉斯”的历史用法表,并且似乎多年来,用法从2:15转向了对正常在1816-1884至8:14(1888-1917)至5:17(1919-1939)至9:10(1947-1976)。

因此,据此,“正常”与“高斯”的用法越来越平等。或者,如果您认为趋势会持续下去,那么“高斯”将在50-100年内击败“正常”水平。


5

在所有好的答案中,我尚未看到的答案是:

出于先前的熟悉程度,我通常使用“正态”,但我想大写以强调其技术含义:“ ...如果数据呈正态分布...”(我不知道我是否从其他地方或自己重新发明)


5

使用哪个取决于所教授的统计数据的水平。不幸的是,我的教学经验表明,大多数本科生从来没有完全掌握概率分布的概念。但是,他们都必须以某种方式掌握CLT以及思考不确定性的方法。对于本科生班,“普通”是更可取的,因为它不会增加新的陌生单词的焦虑感。对于研究生而言,高斯是首选,因为上述所有对规范化的困惑及其提供的历史背景。我教一个本科研究班,要求开设两个前提条件统计学班,并且我在过去30年中看到的所有本科书籍都使用了师范大学。


1
“大多数本科生从来没有完全掌握概率分布的概念” +1
Code-Guru 2014年

4

该名称normal来自一些观察到错误行为正常的观察结果。您将在此处找到更多详细信息。如果这就是将此分布称为正态分布的原因,则可能会引起新的混乱,因为事故计数的正态分布为poisson。我相信我们应该向前迈进,而开始称它为“ a” Gaussian

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.