线性回归中的正态性假设


11

作为线性回归的假设,误差分布的正态性有时被错误地“扩展”或解释为需要y或x的正态性。

是否可以构造一个场景/数据集,其中X和Y是非正态的,但误差项是,因此获得的线性回归估计值是有效的?


5
一个简单的例子:X具有伯努利分布(即取值0或1);Y = X + N(0,0.1)。X和Y都不是正态分布的,但是在X上回归Y仍然有效。
Hong Ooi 2014年

我猜您正在考虑残差的分布,而不是变量的分布。
tashuhka 2014年


Answers:


16

用图像扩展Hong Oois评论。这是一个数据集的图像,其中边际没有正态分布,但残差仍然存在,因此线性回归的假设仍然有效:

在此处输入图片说明

该图像是由以下R代码生成的:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.