在计算总体方差时,我没有得到为什么N
和为什么N-1
。什么时候使用N
以及何时使用N-1
?
它说,当人口很大时,N和N-1之间没有区别,但是并不能说明为什么一开始就有N-1。
编辑:请不要与n
和n-1
用于估计的混淆。
Edit2:我不是在谈论人口估计。
在计算总体方差时,我没有得到为什么N
和为什么N-1
。什么时候使用N
以及何时使用N-1
?
它说,当人口很大时,N和N-1之间没有区别,但是并不能说明为什么一开始就有N-1。
编辑:请不要与n
和n-1
用于估计的混淆。
Edit2:我不是在谈论人口估计。
Answers:
除了尝试数学以外,我将尝试用简单的词来表达。如果您拥有全部人口,则使用分母计算其方差(人口方差)N
。同样,如果您只有样本并且要计算该样本的方差,则使用分母N
(在这种情况下为样本的n)。在这两种情况下,请注意,您无需进行任何估算:测得的均值是真实均值,而根据该均值计算出的方差是真实方差。
现在,您只有样本,并且想推断总体中未知的均值和方差。换句话说,您需要估算。您将样本均值用于总体均值的估计(因为您的样本具有代表性),确定。为了获得总体方差的估计值,您必须假装该均值实际上是总体均值,因此自您进行计算以来,它不再依赖于样本。为了“显示”您现在将其固定,您保留样本中的一个(任何)观察值以“支持”均值:无论样本发生了什么,一个保留的观察值始终可以使均值达到您的期望值ve并相信对采样偶然性不敏感。一种保留的观察结果是“ -1”N-1
在计算方差估计中。
想象一下,您以某种方式知道真实的总体平均值,但是想估计样本中的方差。然后,您可以将该真实均值代入方差公式并应用分母N
:此处不需要“ -1”,因为您知道真实均值,因此无需从同一样本中进行估算。
N
了N和n。N
是总体总数的大小,无论是总体还是样本。要计算总体方差,您必须要掌握总体。如果只有样本,则可以计算该样本的方差或计算总体估计方差。没有其他办法。
通常,当一个人口只有一小部分(即样本)时,应除以n-1。这样做有充分的理由,我们知道将方差与样本均值相乘乘以(n-1)/ n的样本方差是总体方差的无偏估计量。
您可以在此处找到证明样本方差估计量无偏的证明:https : //economictheoryblog.com/2012/06/28/latexlatexs2/
此外,如果要应用总体方差的估计量(即除以n的样本上的方差估计量除以n的版本),则获得的估计值将产生偏差。
过去有一个论点,您应将N用于非推论方差,但我不再建议这样做。您应该始终使用N-1。随着样本数量的减少,N-1可以很好地纠正这一事实,因为样本方差会变小(您更有可能在分布的峰值附近进行采样-见图)。如果样本量确实很大,那么任何有意义的数量都没有关系。
另一种解释是,人口是无法实现的理论结构。因此,请始终使用N-1,因为无论您做什么,充其量都是在估计总体差异。
另外,从现在开始,您将看到N-1的方差估计。您可能永远不会遇到这个问题……除非是在测试中,当老师可能要求您区分推论和推论时非推论方差度量。在这种情况下,请不要使用胡布的答案或我的答案,请参阅ttnphns的答案。
注意,在该图中,方差应该接近1。当您使用N估计方差时,请注意方差随样本大小的变化。(这是在elswhere中所指的“偏差”)
总体方差是总体中所有值的平方偏差的总和除以总体中值的数量。但是,当我们估计样本的总体方差时,会遇到一个问题,即样本值与样本均值的偏差平均比那些样本值与(未知)的真实人口平均值。这导致从样本计算得出的方差比真实总体方差小一点。使用n-1除数代替n可纠正该低估。