如果观察值重复,为什么样本方差会发生变化?


25

差异被认为是价差的量度。因此,我曾认为由于数字均等分布,所以方差3,5等于的方差3,3,5,5。但是情况并非如此,的方差为3,52而的方差3,3,5,51 1/3

鉴于解释说方差应该被用来衡量价差,这令我感到困惑。

那么,在这种情况下,价差的度量是什么意思?

Answers:


32

如果将方差定义为类似于总体方差但如果样本均值为,则两个样本的方差相同。sn2=MSE=1ni=1n(xix¯)2μ

因此,不同的是纯粹由于贝塞尔校正的通常公式样本方差(在,它针对以下事实进行调整:样本均值比总体均值更接近数据,以使其无偏(“取平均”为正确的值)。sn12=nn1MSE=nn11ni=1n(xix¯)2=1n1i=1n(xix¯)2

随着样本数量的增加,效果逐渐消失,因为随变为1 。n1nn

顺便说一句,没有特殊原因需要使用无偏估计量进行方差分析是一个完全有效的估计量,并且在某些情况下可以说比起更常见的形式有优势(无偏量不一定那么大交易)。sn2

差异本身并不直接衡量传播。如果我将数据集中的所有值加倍,我认为它们是“扩展”值的两倍。但是方差增加了4倍。因此,通常说来,标准差而不是方差是对价差的度量。

当然,标准偏差(通常为版本)与方差也会发生相同的问题-当您加倍点时,标准偏差会发生变化,其原因与方差相同。sn1

在小样本中,由于这种影响(复制样本会改变值),因此贝塞尔校正使标准偏差在某种程度上无法直观地衡量传播。但是,在复制样本时,许多扩展度量的确保留了相同的值。我会提到一些

  • sn(当然)

  • 均值的均值(绝对)偏差

  • 与中位数的(绝对)偏差

  • 四分位数范围(至少对于样本四分位数的某些定义)


3
“没有特殊的原因,您必须使用无偏估计量” –实际上,您不必估计任何东西。根据{3, 5}第一个公式,其自身的方差为1。正如您所指出的,发问者试图估计一个据估计是样本的总体方差,但谁知道它是否是样本。
史蒂夫·杰索普

1

作为某种助记符,。因此,样本方差的期望值太低,差异是样本均值的方差。VX=EVX+VEX

常用的样本方差公式对此进行了补偿,并且样本均值的方差与样本大小成反比。

举一个极端的例子,获取单个样本将始终显示样本方差为0,显然不表示基础分布的方差为0。

现在,对于2个和4个均匀加权的样本,校正因子分别为和。因此,您计算出的预期方差相差倍。在两种情况下,样本本身的方差均为。但是第一种情况的情况较弱,因为是基本分布的均值,而其他所有值都将意味着较大的方差。4 / 3 2 / 3 1 42/14/32/314


2
通过将估计量统计相混淆,此答案使问题变得迷惑而不是澄清。请在此主题中阅读Glen_b的原始答案。前两段中的论点很神秘,因为它似乎与该问题无关。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.