Answers:
为什么诊断基于残差?
因为许多假设都与的条件分布有关,而不是与它的无条件分布有关。这相当于对误差的假设,我们通过残差来估计。
在简单的线性回归中,人们经常想要验证是否满足某些假设才能进行推断(例如,残差呈正态分布)。
实际的正态性假设与残差无关,而与误差项有关。与残差最接近的是残差,这就是我们检查残差的原因。
通过检查拟合值是否服从正态分布来检查假设是否合理?
不能。拟合值的分布取决于的模式。它不会告诉您有关假设的任何信息。
例如,我只是对模拟数据进行了回归,为此正确指定了所有假设。例如,错误的正常性得到了满足。当我们尝试检查拟合值的正态性时,将发生以下情况:
假设是什么,我们如何检查它们以及何时需要进行假设?
条件独立/错误独立。可以检查特定形式的依赖性(例如,序列相关)。如果您无法预期依赖的形式,则很难检查。
(实际上,我还没有提到其他一些假设,例如加性误差,误差均值为零等等)。
如果您仅对估计最小二乘线的拟合度感兴趣,而对标准误差不感兴趣,则无需进行大多数此类假设。例如,误差的分布会影响推理(测试和间隔),并且会影响估计的效率,但是LS线仍然是最佳的线性无偏。因此,除非分布非常严重地非正态以至于所有线性估计量都不好,否则,如果对误差项的假设不成立,就不一定是大问题。