为什么在检验正态性时残差的相关性不重要?


9

当(即,来自线性回归模型)时, ,在这种情况下为残差是相关的而不是独立的。但是,当我们进行回归诊断并想测试假设 ,每本教科书都建议对残差使用Q–Q图和统计检验旨在测试某些。Y=AX+εY

εN(0,σ2I)e^=(IH)YN(0,(IH)σ2)
e^1,,e^nεN(0,σ2I)e^e^N(0,σ2I)σ2R

对于这些测试,残差是相关的而不是独立的无关紧要?通常建议使用标准化残差: 但这仅使它们同余,而不是独立的。

e^i=e^i1hii,

重新表述这个问题: OLS回归中的残差是相关的。我知道在实践中,这些相关关系是如此之小(大多数时候?总是?),在测试残差是否来自正态分布时可以忽略不计。我的问题是,为什么?


1
使它们同调。
Scortchi-恢复莫妮卡

1
当残差具有很强的相关性时,您是在问这些测试的适用性吗?还是只是在担心最小二乘估计程序产生的(非常轻微和无关紧要的)负相关性?
ub

1
@whuber我在问最小二乘估计程序产生的相关性。如果它们很小且无关紧要,我想知道为什么。
Zoran Loncarevic

Answers:


3

用你的记号 H 是投影的列空间吗 X,即所有回归变量的子空间。因此M:=InH 是在所有回归变量所跨越的与子空间正交的所有事物上的投影。

如果 XRn×k, 然后 e^Rn 如您所述,是奇异正态分布,并且元素是相关的。

错误 ε 是不可观察的,并且通常不正交于由 X。为了论证,假设错误εspan(X)。如果这是真的,我们将有y=Xβ+ε=y~+εy~ε。以来y~=Xβspan(X),我们可以分解 y 并得到真实 ε

假设我们有一个基础 b1,,bnRn,第一个 b1,,bk 基向量跨子空间 span(X) 其余的 bk+1,,bn 跨度 span(X)。一般来说,错误ε=α1b1++αnbn 将具有非零分量 αi 对于 i{1,,k}。这个非零分量将​​与Xβ 因此无法通过投影在 span(X)

因为我们永远都希望恢复真正的错误 εe^ 相关单数 n维法线,我们可以变换 e^RneRnk。在那里我们可以拥有

eNnk(0,σ2Ink),
e是非奇异的不相关且等方正态分布。残差e称为Theil的BLUS残差

关于回归扰动的正态性测试的简短文章中您可以找到OLS和BLUS残差的比较。在测试的蒙特卡洛设置中,OLS残差优于BLUS残差。但这应该给您一些起点。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.