平均绝对偏差与标准偏差


35

在Greer(1983)的教科书“ O水平的新综合数学”中,我看到了计算出的平均偏差,如下所示:

总结单个值与平均值之间的绝对差。然后得到其平均值。在本章中,使用术语“ 平均偏差”

但是我最近看到了一些使用术语标准差的引用,这就是它们的作用:

计算单个值与平均值之间的差的平方。然后得到他们的平均值,最后得到答案的根源。

我对一组通用数据尝试了这两种方法,它们的答案也不同。我不是统计学家。试图教我的孩子们偏差时,我感到困惑。

简而言之,术语“ 标准差”和“ 平均差 ”是否相同?还是我的旧教科书错误?


2
这两个数量不同。他们对数据的加权不同。标准偏差将更大,并且相对较大地受到较大影响。标准偏差(最特别是n分母形式)可以认为是均方根偏差。标准偏差更常用。
Glen_b-恢复莫妮卡2014年


加里•卡德(Gary Kader)有一种有趣的方式来教孩子们得出平均绝对偏差
伊恩·塞缪尔·麦克莱恩

1
顺便说一句,人们倾向于标准偏差的原因之一是因为无关随机变量之和的方差相加(相关变量也有一个简单的公式)。均值偏差不会发生。
Glen_b-恢复莫妮卡(Monica)2015年

2
@Alexis的措辞很差。对于独立随机变量,Var(X + Y)= Var(X)+ Var(Y)。这个事实到处都在使用(导致熟悉的n标准化涉及均值的公式时使用的术语,例如在一个样本t统计中)。均值偏差没有相应的普遍事实。
Glen_b-莫妮卡(Monica)恢复

Answers:


27

两者都回答了您的值在观测平均值周围分布的程度。

均值以下1的观察值与均值相等“远”,因为其值比均值高1。因此,您应该忽略偏差的符号。这可以通过两种方式完成:

  • 计算偏差的绝对值并将其相加。

  • 对偏差求平方并求和这些平方。由于平方,您会赋予较高的权重较高的偏差,因此,这些平方的总和将与均值之和不同。

在计算出“绝对偏差之和”或“平方偏差之和的平方根”后,将它们取平均值,分别得到“平均偏差”和“标准偏差”。

平均偏差很少使用。


因此,当人们简单地说“偏差”时,它们的意思是“标准偏差”吗?
itsols 2014年

我同意从普通人的观点来看,上面的1或下面的1表示有意义的“改变”或“分散”。但是平方它会带来更大的价值,而这可能并不是我的“实际改变”。也许我错了,但这就是我的看法:/
itsols 2014年

大多数情况下,使用标准偏差(方差的平方根)一词。通常完成平方的计算,因为它有助于进行许多其他计算。
卡巴斯尔2014年

1
@itsols从技术上讲,您应始终指定要为数据集计算的偏差统计信息的类型-偏差一词本身应指单个数据点与均值的偏差(Kasper在答案中使用它的方式) )。
AmeliaBR 2014年

@ itsols,+ 1到Amelia。确实,没有人说数据集统计信息只是“偏差”。统计是“平均绝对偏差”或“均方根偏差”等。
ttnphns 2014年

15

今天,统计值主要由计算机程序(Excel,...)计算,不再由手持式计算器计算。因此,我认为计算“平均偏差”并不比计算“标准偏差”麻烦。尽管标准差可能具有“ ...使其在统计学中更有用的数学特性”,但实际上,它是均值方差概念的一种失真,因为它为远离均值的数据点提供了额外的权重。可能要花一些时间,但是我希望统计学家在讨论数据点之间的分布时能更多地回到使用“平均偏差”的方法上,它可以更准确地表示我们实际如何看待分布。


您对人们(在统计上合格的)如何“实际思考”提出了非同寻常的主张。您有关此信息的来源是什么?
whuber

7
消息来源只是我就这个主题向我提问的人,还有我自己。当被问到:如何描述该数据集中的变化?响应始终以与均值的线性距离表示-响应永远不包括平方或平方根。当然,我是工程师,而不是“统计学家”,但我想请任何其他人在这个话题上挑战自己。是的,我们喜欢标准差的数学运算-很有趣,但这真的是您如何描绘均值的偏差吗?
andyl 2014年

2
这取决于目的。为了进行数据探索,我倾向于使用基于等级的可靠估计值,例如与中位数的中位数偏差,从本质上讲,这与您的建议很接近。但是对于其他许多工作,尤其是在评估(甚至在心理上)具有统计学意义的潜力,估计适当的样本量,弄清信息的价值以及确定竞争性的统计程序之间时,要考虑方差(因此是标准差)。必要。正如数学清楚地表明的那样,平均偏差不能替代。
whuber

1
查看本文
皮特

@Pete您如何到达那里?
Vicrobot

9

他们都衡量相同的概念,但并不相等。

您正在比较1n|xix¯|。它们不相等有两个原因:1n(xix¯)2

首先,平方根运算符不是线性的,或者。因此绝对偏差的总和不等于偏差平方之和的平方根,即使作为平方函数后跟一个平方根绝对值函数可表示为:Σ| X- ˉ X | =Σa+ba+b
的总和被计算后作为平方根取。|xix¯|=(xix¯)2(xix¯)2

其次,在标准差计算中,现在也位于平方根下。n

尝试计算1n(xix¯)2

首选标准偏差的原因是,从数学上讲,当计算变得更加复杂时,更易于使用。


3
和的绝对值,在一般情况下,相同的绝对数值的总和!平方,平方根或绝对函数都不是线性的,这就是为什么应用函数后的和与求和后应用的函数不同的原因。
AmeliaBR 2014年

@AmeliaBR您当然完全正确!
ltronneberg 2014年

但是,其余的论点都很好,这就是为什么我决定编辑有问题的陈述的原因。
AmeliaBR 2014年

8

@itsols,我将添加到Kasper的重要概念中The mean deviation is rarely used为什么通常认为标准偏差比平均绝对偏差更好地衡量变异性?因为算术平均值是与之最小平方和(而非绝对值之和)的轨迹。

假设您要评估利他程度。这样一来,您可能就不会问一个人,他准备在人生的“一般情况”下捐多少钱。相反,您会选择问他在有限的情况下愿意做多少事情,在这种情况下,他自己的生活可能只有最少的资源。即,当个人利他主义的数量是个人的最小值时,它的数量是多少?

同样,这些数据的可变程度是多少?直观地讲,最佳的测量指标是在这种情况下最小化(或最大化)到极限的指标。上下文是“围绕算术平均值”。然后圣。从这个意义上说,偏差是最佳选择。如果上下文位于“中位数附近”,则表示|偏差|。将是最佳选择,因为中位数是与其绝对偏差最小的总和。


4
您基于所在地的SD证明是合理的。您通过对算术平均值给予特别的重视来证明SD的合理性-所有这些表明,它们之间存在关系,而不是SD是特殊的。同样,人们可以将重要性放在中位数上,中位数是绝对损失的最小总和。经常使用SD的真正原因是因为数学更易于使用……此外,它更易于计算(均因为中位数需要“排序”,并且平方的计算要比分支语句要快)。哲学上的绝对偏差具有更大的价值。
samthebest

7

值得补充的一件事是,您30岁的教科书使用绝对平均偏差而不是标准偏差的最可能原因是手动计算更容易(无平方/平方根)。现在,高中学生可以轻松使用计算器,因此没有理由不要求他们计算标准差。

在某些情况下,在复杂模型拟合中使用绝对偏差代替标准偏差。与标准偏差相比,绝对偏差对极端离群(远离均值/趋势线的值)不敏感,因为在将其添加到其他数据点的值之前,绝对偏差不会使该距离平方。由于模型拟合方法旨在减少与趋势线的总偏差(根据计算的方法偏差为准),因此使用标准偏差的方法最终可能会创建一条趋势线,该趋势线偏离大多数点,从而更接近异常值。使用绝对偏差可以减少这种失真,但是要以增加趋势线的计算为代价。

正如其他人所指出的那样,这是因为标准偏差具有数学属性和关系,通常使它在统计中更加有用。但是永远不要将“有用”与完美混淆。


1
只是好奇,什么使SD比平均绝对偏差有用的“数学属性”?好的答案。
Weipeng L

@pongba标准偏差是许多统计模型所固有的,这些模型假定会因多种影响而相互抵消的随机变化(又称正态分布数据)。这包括使用来自大量人群的调查时的采样精度(误差范围)。如果您的数据符合此模型,则可以从均值的SD数估计获得值的可能性。您可以根据单个组件的SD计算多个独立效果的SD。另请参见:en.m.wikipedia.org/wiki/Standard_deviation
AmeliaBR'British

7

两者都通过计算数据与平均值的距离来测量数据的分散性

  1. 平均绝对偏差是使用范数L1(它也被称为曼哈顿距离或直线距离
  2. 标准偏差是使用L2范数(也称为欧几里得距离

这两个规范之间的差异在于,标准偏差是在计算差异的平方,而平均绝对偏差仅是在看绝对差异。因此,当使用标准偏差而不是其他方法时,较大的离群值将产生较高的离差。确实,欧几里德距离也经常使用。主要原因是标准差当数据以正态分布时,具有很好的属性。因此,在此假设下,建议使用它。但是,人们通常对实际上没有正态分布的数据进行此假设,这会造成问题。如果您的数据不是正态分布的,您仍然可以使用标准差,但是在解释结果时应格外小心。

最后,您应该知道,对于p = 1和p = 2 ,两种色散度量都是Minkowski距离的特殊情况。您可以增加p以获取其他衡量数据分散性的方法。


在math.stackexchange上也有关于此主题的文章:math.stackexchange.com/questions/384003/l1-norm-and-l2-norm
RockScience 2014年

6

它们是试图量化相同概念的相似度量。通常,您使用st。偏差,因为它具有良好的属性,如果您对基础分布进行一些假设。

另一方面,从数学的角度来看,均值偏差的绝对值会引起一些问题,因为您无法区分它,也无法轻松对其进行分析。这里一些讨论


1

不,你错了。开玩笑。但是,有许多可行的原因使人们想要计算均值偏差而不是正式的标准差,因此我同意我的工程学弟兄的观点。当然,如果我正在计算统计数据以与大量表示定性和定量结论的现有工作进行比较,那么我会坚持使用std。但是,例如,假设我正在尝试快速运行二进制,机器生成的数据的异常检测算法。我并没有将学术比较作为我的最终目标。但是我对有关特定数据流的均值“散布”的基本推断感兴趣。我也对尽可能高效地迭代计算感兴趣。在数字电子硬件中,我们一直都在耍肮脏的把戏–我们将乘法和除法分别提取为左右移位,对于“计算”绝对值,我们只需删除符号位(并在必要时计算一个或两个的补数) ,都是简单的转换)。因此,我的选择是以可能的最繁琐的方式对其进行计算,然后将线性阈值应用于我的计算中,以便在所需的时间窗口内快速进行异常检测。


1
就像任何时刻一样(包括平均绝对偏差),都可以使用在线算法高效且简单地计算标准偏差。因此,对快速或简单计算的要求不会排除这一点(也不会排除基于矩的基于矩的估计量)。
ub

0

这两种措施的确不同。第一个通常称为平均绝对偏差(MAD),第二个称为标准偏差(STD)。在计算能力和程序存储器受到严格限制的嵌入式应用程序中,非常希望避免平方根计算。

通过快速粗略测试,对于一组高斯分布随机样本,似乎MAD = f * STD,且f在0.78至0.80之间。


0

Amar Sagoo的一篇很好的文章对此进行了解释:[ http://blog.amarsagoo.info/2007/09/making-sense-of-standard-deviation.html]

为了增加我对直观理解的尝试:

均值偏差是询问假设的“平均”点与均值有多远的一种体面的方式,但对于询问所有点之间的距离或数据的“散布”程度并没有真正的作用。

标准偏差是指所有点之间的距离,因此它包含的信息不只是平均偏差(这就是为什么平均偏差通常仅用作理解标准偏差的垫脚石)的原因。

勾股定理是一个很好的类比。勾股定理告诉我们二维点之间的距离,方法是取水平距离和垂直距离,对它们进行平方,相加平方,然后求和平方根。

如果仔细观察,(人口)标准偏差的公式基本上与勾股定理相同,但是具有远大于二维的维(并且将每个点到均值的距离用作每个维的距离)。因此,它可以最准确地显示数据集中所有点之间的“距离”。

为了进一步推论该类比,平均绝对偏差就像取水平和垂直距离的平均值,该平均值比总距离短,而绝对绝对值之和将是水平和垂直距离的总和,较长比实际距离。


我假设当您说平均偏差时,您的意思是绝对偏差,这就是OP所说的。术语很重要,因为均值偏差始终为0。关于均值绝对偏差和标准偏差之间的差异,二者均涉及所有点均值与均值的偏差。其中包括从均值的绝对偏差的总和,而为平方根如果偏差平方的总和..
迈克尔·Chernick

0

标准偏差表示由于随机过程引起的分散。具体而言,预期由于许多独立过程之和而导致的许多物理测量结果具有正态(钟形曲线)分布。

Y=1σ2πe(xμ)22σ2

Yxμσ

换句话说,标准偏差是一个因独立的随机变量相加而产生的术语。因此,我不同意这里给出的一些答案-标准偏差不仅是均值偏差的替代方案,均值偏差“可能为以后的计算更方便”。标准偏差是对正态分布现象进行离散建模的正确方法

如果查看方程式,则可以看到标准偏差越重,而与均值的偏差越大。直观地,您可以将平均值偏差视为与平均值之间的实际平均偏差,而标准偏差说明平均值周围呈钟形(也称为“正态”)分布。因此,如果您的数据呈正态分布,则标准偏差会告诉您,如果您对更多的值进行采样,则会在均值周围的一个标准偏差内找到约68%的值。

另一方面,如果您有一个随机变量,则分布可能看起来像一个矩形,值出现在范围内任何位置的可能性均等。在这种情况下,平均偏差可能更合适。

TL; DR如果您有由于许多潜在随机过程引起的数据或只是知道正态分布的数据,请使用标准偏差函数。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.