当(即,来自线性回归模型)时, ,在这种情况下为残差是相关的而不是独立的。但是,当我们进行回归诊断并想测试假设 ,每本教科书都建议对残差使用Q–Q图和统计检验旨在测试某些。
对于这些测试,残差是相关的而不是独立的无关紧要?通常建议使用标准化残差: 但这仅使它们同余,而不是独立的。
重新表述这个问题: OLS回归中的残差是相关的。我知道在实践中,这些相关关系是如此之小(大多数时候?总是?),在测试残差是否来自正态分布时可以忽略不计。我的问题是,为什么?
当(即,来自线性回归模型)时, ,在这种情况下为残差是相关的而不是独立的。但是,当我们进行回归诊断并想测试假设 ,每本教科书都建议对残差使用Q–Q图和统计检验旨在测试某些。
对于这些测试,残差是相关的而不是独立的无关紧要?通常建议使用标准化残差: 但这仅使它们同余,而不是独立的。
重新表述这个问题: OLS回归中的残差是相关的。我知道在实践中,这些相关关系是如此之小(大多数时候?总是?),在测试残差是否来自正态分布时可以忽略不计。我的问题是,为什么?
Answers:
用你的记号 是投影的列空间吗 ,即所有回归变量的子空间。因此 是在所有回归变量所跨越的与子空间正交的所有事物上的投影。
如果 , 然后 如您所述,是奇异正态分布,并且元素是相关的。
错误 是不可观察的,并且通常不正交于由 。为了论证,假设错误。如果这是真的,我们将有 与 。以来,我们可以分解 并得到真实 。
假设我们有一个基础 的 ,第一个 基向量跨子空间 其余的 跨度 。一般来说,错误 将具有非零分量 对于 。这个非零分量将与 因此无法通过投影在 。
因为我们永远都希望恢复真正的错误 和 相关单数 维法线,我们可以变换 。在那里我们可以拥有
在关于回归扰动的正态性测试的简短文章中,您可以找到OLS和BLUS残差的比较。在测试的蒙特卡洛设置中,OLS残差优于BLUS残差。但这应该给您一些起点。