Answers:
解决这个问题的一种方法是反过来看:我们如何从正态分布的残差开始并将它们安排为异方差?从这个角度来看,答案变得显而易见:将较小的残差与较小的预测值相关联。
为了说明,这是一个显式构造。
相对于线性拟合(以红色显示),左侧的数据显然是异方差的。这由右侧的残差与预测图驱动。但是-通过构造- 无序残差集接近正态分布,如中间的直方图所示。(Shapiro-Wilk正常性检验中的p值为0.60,这是在运行以下代码后发出的R
命令所获得的shapiro.test(residuals(fit))
。)
真实数据也可能像这样。道德观念是,异方差刻画了残差大小与预测之间的关系,而正态性并没有告诉我们残差如何与其他任何因素相关。
这是R
此构造的代码。
set.seed(17)
n <- 256
x <- (1:n)/n # The set of x values
e <- rnorm(n, sd=1) # A set of *normally distributed* values
i <- order(runif(n, max=dnorm(e))) # Put the larger ones towards the end on average
y <- 1 + 5 * x + e[rev(i)] # Generate some y values plus "error" `e`.
fit <- lm(y ~ x) # Regress `y` against `x`.
par(mfrow=c(1,3)) # Set up the plots ...
plot(x,y, main="Data", cex=0.8)
abline(coef(fit), col="Red")
hist(residuals(fit), main="Residuals")
plot(predict(fit), residuals(fit), cex=0.8, main="Residuals vs. Predicted")
在加权最小二乘(WLS)回归中,您可能希望能够看到的估计残差的随机因素呈正态分布,尽管它通常并不十分重要。如简单的(一个回归变量,并通过原点)回归案例所示,估计的残差可以在https://www.researchgate.net/publication的第1页底部以及第2和7页的下半部分中进行分解。/ 263036348_Properties_of_Weighted_Least_Squares_Regression_for_Cutoff_Sampling_in_ Establishmentment_Surveys 无论如何,这可能有助于显示常态可以进入图片的位置。
ncvTest
该功能的车包了R
正式进行测试异。在whuber的示例中,该命令ncvTest(fit)
产生的值几乎为零,并提供了有力的证据证明恒定的误差方差(当然是期望的)。