当N增加时,缩小的变异性就是样本均值的变异性,通常表示为标准误差。或者,换句话说,样本均值准确性的确定性正在提高。
假设您进行了一项实验,收集了3名男性和3名女性,并测量了他们的身高。您如何确定每组的平均身高是男性和女性人口的真实均值?我应该认为您根本不确定。您可以轻松地收集3个新样本,并找到距离第一个样本几英寸的新均值。如此反复的实验中,有很多甚至可能导致女性的身高比男性高,因为方法的差异很大。N较低时,您无法确定样本均值的确定性,并且样本之间的差异很大。
现在想象每组10,000个观测值。很难找到10,000个均值相差很大的新样本。它们的可变性要小得多,您将更加确定它们的准确性。
σn−−√。该标准误差表示计算中均值或效果的可变性。它越小,统计测试的功能就越强大。
这是R中的一个小模拟,用来演示标准误差与初始实验中许多重复试验的平均值之间的关系。在这种情况下,我们将从总体平均值100和标准差15开始。
mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)
注意最终的标准偏差如何接近理论标准误差。通过在此处使用n变量,您可以看到随着n的增加,可变性度量将变小。
[顺便说一下,图中的峰度并没有真正改变(假设它们是正态分布)。降低方差不会改变峰度,但分布看起来会更窄。目视检查峰度变化的唯一方法是使分布具有相同的比例。]