观察到左偏斜与对称分布


10

这对我来说很难描述,但我会尽力使我的问题易于理解。因此,首先您必须知道,到目前为止,我已经完成了非常简单的线性回归。在估算系数之前,我先观察了的分布。左偏斜很重。在估算了模型之后,我非常确定会在QQ图中观察到左偏残差,但我绝对没有。此解决方案可能是什么原因?错误在哪里?还是分布与误差项的分布无关?ÿÿ


@Aniko 回答了您之前的问题,给出了一个不错的答案
ub

Answers:


22

为了回答您的问题,让我们举一个非常简单的例子。简单回归模型由,其中。现在假设是二分法的。如果不等于零,则的分布将不是正态的,而是实际上是两个正态分布的混合,一个具有均值,另一个具有均值。ÿ一世=β0+β1个X一世+ϵ一世ϵ一世ñ0σ2X一世β1个ÿ一世β0β0+β1个

如果足够大而足够小,则的直方图将看起来是双峰的。但是,也可以得到的直方图,看起来像是“单个”偏斜分布。这是一个示例(使用R):β1个σ2ÿ一世ÿ一世

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

重要的不是的分布,而是错误项的分布。ÿ一世

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

那看起来很正常-不仅比喻=)


“但是误差项的分布”您的意思是残差而不是误差项,对吗?有关残差与错误的更多信息:stats.stackexchange.com/questions/133389/…–
vasili111

7

参考@Wolfgang的出色答案,以下是他的R代码的图:

在此处输入图片说明

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.