标准偏差在非正态分布中告诉我们什么


40

在正态分布中,68-95-99.7规则赋予标准差很多含义,但是在非正态分布(多峰或偏态)中,标准差意味着什么?所有数据值是否仍会落在3个标准偏差之内?对于非正态分布,我们是否有像68-95-99.7这样的规则?



@COOLSerdash太好了。这完全可以回答我的问题。
Zuhaib Ali 2014年

3
@COOLSerdash的观点在这里很明确,但请注意,切比雪夫不等式的标准陈述与已知的先验先验真实SD有关,而不是样本中估算的SD。读一下这个出色的CV线程可能会有所帮助:单边Chebeshev不等式的样本版本是否存在?
gung-恢复莫妮卡

另外,您可能不应该马上就适应切比雪夫,可能会做得更好,无论是否偏斜。
史蒂夫·S

1
@gung 68-95-99.7规则也是如此!
Glen_b 2014年

Answers:


12

标准偏差是变化的一种特定度量。还有其他几种,平均绝对偏差非常流行。标准偏差绝不是特别的。使它显得特别的是高斯分布很特别。

正如评论中指出的那样,切比雪夫的不平等对于获得感觉很有用。但是还有更多


9

它是第二个中心(方差)的平方根。这些矩与特征函数(CF)有关,由于它们定义了概率分布,因此将它们称为特征。因此,如果您知道所有时刻,那么您就会知道CF,因此就知道整个概率分布。

正态分布的特征函数仅由两个时刻定义:均值和方差(或标准偏差)。因此,对于正态分布,标准偏差尤为重要,以某种方式占其定义的50%。

对于其他分布,标准偏差在某些方面不太重要,因为它们具有其他矩。但是,对于实践中使用的许多分布而言,最初的时刻是最大的,因此它们是最重要的。

现在,直观地,均值告诉您分布中心在哪里,而标准差则告诉您数据离该中心有多近。

由于标准差是以变量为单位的,因此它也可以用于缩放其他矩以获得诸如峰度的度量。峰度是一个无量纲的指标,它告诉您与正常情况相比,分布的尾巴有多胖


1
“现在,从直观上讲,均值告诉您分布中心在哪里,而标准差则告诉您数据离该中心有多近。” -这仅在分布为正态时适用吗?否则,中位数通常是集中趋势的更好度量。
丹·特金

@DanTemkin使用中位数时,标准偏差会在一定程度上失去其值。它是根据平均值计算得出的。对于中位数,谈论分位数是有意义的,这可能是处理偏态分布的一种方法。OP并不专注于偏斜的分布。因此,对于任何对称分布,您的均值=中值,就不会有正态分布。因此,在讨论标准差时谈论均值是有意义的。
阿克萨卡尔州

4

样品标准偏差是测量观测值与平均值的偏差的量度,以相同单位来测量数据。正态分布与否。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.