为什么我们采用方差的平方根来创建标准偏差?


26

抱歉,如果在其他地方都没有找到答案,我找不到它。

我想知道为什么我们要特别求方差的平方根来创建标准偏差?将平方根产生有用的值是什么?



2
将标准偏差视为欧几里得向量范数,然后将方差视为平方。事实证明,方差和标准偏差的定义具有有用的分析属性。
theideasmith

Answers:


44

从某种意义上说,这是一个微不足道的问题,但在另一方面,它实际上是很深的!

  • 正如其他人提到的那样,取平方根表示具有与相同的单位。Stdev(X)X

  • 求平方根可为您提供绝对同质性,也就是绝对可伸缩性。对于任何标量和随机变量,我们具有: 的绝对均匀性必需的属性 a的范数。可以将标准偏差解释为范数(在均值零个随机变量的向量空间上),类似于是三维中的标准欧几里得范数空间。标准偏差是对随机变量与其平均值之间的距离的度量。αX

    Stdev[αX]=|α|Stdev[X]
    x2+y2+z2

标准差和范数L2

有限尺寸的情况:

在维向量空间中,标准的Euclidian规范(又称规范)定义为:nL2

x2=ixi2

更广泛地说, -norm取根为绝对值同质性:。p xp=(i|xi|p)1ppαxp=(i|αxi|p)1p=|α|(i|xi|p)1p=|α|xp

如果您有权重则加权和也是有效的范数。此外,如果代表概率并且,则这是标准偏差qiixi2qiqiE[x]ixiqi=0

无限尺寸的情况:

在无限维希尔伯特空间中,我们类似地可以定义范数L2

X2=ωX(ω)2dP(ω)

如果是平均零随机变量,而是概率度量,则标准偏差是多少?相同:。XPωX(ω)2dP(ω)

摘要:

取平方根表示标准偏差满足绝对均一性,这是规范必需属性

随机变量的空间中,是一个内积和的由内在产物引起的规范。因此,标准差是一个随机变量的范数: 这是与平均值到。X,Y=E[XY]X2=E[X2]

Stdev[X]=XE[X]2
E[X]X

(技术要点:虽然是一个标准,但标准差通常不是随机变量的范数,因为当且仅当,对范数向量空间的要求是。标准偏差为0不会。 t表示随机变量为零元素。)E[X2]E[(XE[X])2]x=0x=0


1
这个答案的确是问题的核心,它比目前接受的答案更有意义。
00prometheus

26

方差定义为,因此它是X与期望值之间平方差的期望。XV(X)=E(XE(X))2

如果是以秒为单位的时间,则以秒为单位,但是在而再次以秒为单位。XXE(X)V(X)seconds2V(X)


我知道,是在计算方差时才消除因平方差导致的比例变化吗?
戴夫

11
对-只是尺寸改变而不是比例改变。
让·弗朗索瓦·科贝特

但这并不像那里有一个词:掌权2时有很多,每个词都比其他词多多少少。但是当我们扎根时,我们会忽略这种差异,不是吗?我们将无法获得初始分子,即所有差异的总和。为每个术语取平方根会更好吗?
parsecer

听起来您正在考虑基于样本的估计。在这种情况下,如果您这样做,则差异将为零:。V^i=1n(xix¯)=i=1nxii=1nxi=0
HStamper

@EricMittman除了而不是,在这种情况下,您将得到平均绝对误差a2=|a|a
Dougal

6

简单的答案是,单位与平均值的比例相同。示例:我估计中学生的平均水平为160厘米,标准差(SD)为20厘米。这是直观更容易获得与SD比400厘米^ 2方差的变化感。


0

简而言之,标准差旨在为我们提供一个正数,该正数说明我们的均值数据分布。

如果我们只是将所有点与均值的距离相加,那么正方向和负方向上的点将以一种趋向于趋向于均值的方式组合在一起,并且我们将丢失有关价差的信息。这就是为什么我们首先测量方差的原因,以便通过平方将所有距离保存为正数,并且它们不会相互抵消。最后,我们需要一个正值来代表我们开始使用的单位-上面已经对此进行了评论-因此我们采用正平方根。


-3

由于智力上的懒惰,这是历史上的愚蠢,我们继续这样做。他们选择对均值之差进行平方,以消除负号。然后,他们取平方根,以使其达到与均值相似的比例。

有人应该生成新的统计数据,使用模数或偏离均值的绝对值来计算方差和SD。这将消除整个平方运算,然后进行平方根运算。


1
我们已经以均值(或中位数)绝对偏差,L1规范等形式获得了该信息。但是,传统方法主要优点是,与绝对值不同,它是可微的,这使您能够分析性地最小化和最大化事物。
马特·克劳斯

1
您无法为自己的立场提供实质性的理由,请提供一个清晰列出的数学论证。绝对值的总和与平方和的平方根截然不同。后者强调极值的贡献,这是有用的属性。同样,SSQ是最小二乘分析方法的核心。请花一些时间来探讨SD的问题以及替代方案的比较方式,以便读者理解您的观点。。
6

(-1)阅读诸如“历史性愚蠢”和“智力懒惰”之类的词是自指的,这太容易了。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.