为什么在标准差公式中对样本计数“ N”取平方根?


9

我正在尝试了解标准差的一个非常基本的概念。

根据公式σ=i=1n(xiμ)2N

我不明白为什么我们要将人口“ N”减半,即为什么当我们不做{N ^ 2}时为什么要取\ sqrt {N }呢?这是否会使我们正在考虑的人口倾斜?NN2

公式不应是σ=i=1n(xiμ)2N

Answers:


10

您试图找到与平均值的“典型”偏差。

方差是“与均值的平均平方距离”。

标准偏差是该值的平方根。

这使其与均值的均方根偏差。

  1. 为什么要使用均方差?是什么使方差有趣?其中,由于存在关于方差基本事实,即不相关变量之和的方差是各个方差的总和。(这在很多问题中都涉及,例如, 在CrossValidated上。此处不提供此方便的功能,例如,平均绝对偏差。
  2. 为什么要扎根呢?因为这样它与原始观测值的单位相同。它从均值(如前所述,RMS距离)测量一种特殊的“典型距离”,但是由于上述方差性质,它具有一些不错的功能。

7

标准偏差是的平方根方差

方差是数据与平均值的平均平方距离。由于平均值是总和除以相加的项目数,因此方差的公式为: 再一次,由于标准偏差只是其平方根,因此标准偏差的公式为: 尚未添加或更改任何内容假设或这里的变化,我们只是把方差的平方根,因为这是标准偏差是什么

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

也许应该提到,该方差公式仅适用于离散制服。否则可能会混淆样本与总体方差之间的区别
泰勒

@泰勒,我不知道你的意思。方差的公式与分布无关。
gung-恢复莫妮卡

(样本)方差的公式与分布无关(en.wikipedia.org/wiki/Expected_value#Definition)–
泰勒

@泰勒,我仍然不知道你的意思。方差的公式与分布无关。引自维基百科页面,“随机变量X的方差是与X的均值平方偏差的期望值...。此定义包含由离散,连续,既不混合也不混合的过程生成的随机变量。” 该公式不仅适用于离散均匀。Var(X)=E[(Xμ)2]
gung-恢复莫妮卡

是的,是的,如果您使用,但是对于任何随机变量,不一定相等,。对于一个来说,第一个是常数,第二个是随机数。实际上,目前尚不清楚总和是否超出了的支持范围或样本数量。如果是后者,您很奇怪,这在实践中很少见。如果是前者,那么是的,仅适用于离散(因为这是一个总和)制服(因为权重都是均匀的)。μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
泰勒

1

首先要了解的是,标准偏差(std)与平均绝对偏差不同。这两个定义了关于数据的不同数学属性。

与平均绝对偏差不同,标准偏差(std)对远离均值的值的权重更大,这是通过对差值求平方来实现的。

例如,对于以下四个数据点:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

平均绝对偏差(aad),并且=16/4=4.0

标准偏差(std)=80/4=20=4.47

在数据中,有两个与均值相距6距离的点,以及两个与均值相距2距离的点。因此,偏差4.47比4.更有意义。

由于总观测值始终为,因此在计算std时,我们不会用来求潜水,而是将总方差除以并取其平方根,以使其与原始数据相同。NNN


0

@Mahesh Subramaniya-这只是数学上的扭曲。当我们具有类原始值时。我们可以使用这两个方程和获得相同的值。a/b=()da2b=ccb=d

例如,只需使用 =。但是,我们只希望价值不减。522.5

现在,。并且522=12.512.52=2.5

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.