Answers:
为了回答您的问题,让我们举一个非常简单的例子。简单回归模型由,其中。现在假设是二分法的。如果不等于零,则的分布将不是正态的,而是实际上是两个正态分布的混合,一个具有均值,另一个具有均值。
如果足够大而足够小,则的直方图将看起来是双峰的。但是,也可以得到的直方图,看起来像是“单个”偏斜分布。这是一个示例(使用R):
xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)
重要的不是的分布,而是错误项的分布。
res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))
那看起来很正常-不仅比喻=)