假定以下情况:
我们有大量(例如20个),小组规模较小(例如n = 3)。我注意到,如果我从均匀分布生成值,则即使误差分布均匀,残差也将看起来近似正态。以下R代码演示了此行为:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
如果我查看三个一组的样本的残差,则很明显会出现这种情况:
由于是标准偏差相差不大的随机变量之和,因此其分布比各个项更接近于正态分布。
现在假设我对真实数据而不是模拟数据也有相同的情况。我想评估关于正态性的ANOVA假设是否成立。最推荐的程序建议对残留物进行目视检查(例如QQ图)或对残留物进行正态性测试。如我上面的示例所示,这对于小组人数很少并不是最佳选择。
当我有许多小尺寸的组时,还有更好的选择吗?