违反线性回归的同调假设的危险是什么?


28

例如,考虑ChickWeightR中的数据集。方差明显随时间增长,因此,如果我使用简单的线性回归,例如:

m <- lm(weight ~ Time*Diet, data=ChickWeight)

我的问题:

  1. 该模型的哪些方面值得怀疑?
  2. 问题是否仅限于在Time范围外推断?
  3. 线性回归对这种假设的违反有多大的容忍度(即必须引起异方差才能引起问题)?

1
除了答案中提到的内容外,您的预测间隔也将没有正确的覆盖范围。
Glen_b-恢复莫妮卡2014年

Answers:


22

在这种情况下,线性模型(或“普通最小二乘”)仍然具有其无偏属性。

面对误差方面的异方差,您仍然具有无偏的参数估计,但您对协方差矩阵不满意:您的推论(即参数测试)可能不正确。通用解决方案是使用可靠的方法来计算协方差矩阵(即标准误差)。您使用的哪个方法在某种程度上取决于领域,但是White的方法只是一个开始。

为了完整起见,误差项的序列相关性更差,因为它将导致参数估计有偏差。


对标准误差的可靠估计(如White的方法)有助于对参数进行测试/置信区间,但对预测区间没有帮助吗?
kjetil b halvorsen 2014年

参数向量的协方差用于计算预测,因此您的预测间隔通常也会有偏差。
Mustafa S Eisa

正确。不偏不倚的保持,推断可能会关闭。其他两个段落是正确的。
Dirk Eddelbuettel

1
感谢您抓住它并保持露骨(而不是默默地“降职”,降票)。在使用术语时,我只是一点点草率。现在好点了。
Dirk Eddelbuettel

23

均方根性是高斯马尔可夫假设之一,OLS要求其为最佳线性无偏估计量(BLUE)。

β

简要总结来自上述网站的信息,异方差性不会在您的系数估计中引入偏见。但是,给定异方差性,您将无法正确估计方差-协方差矩阵。因此,系数的标准误差是错误的。这意味着无法计算任何t统计量和p值,因此不可能进行假设检验。总体而言,在异方差下,OLS失去了效率,不再是蓝色。

但是,异方差不是世界末日。幸运的是,校正异方差并不困难。三明治估计器使您可以估计系数的一致标准误差。然而,通过三明治估计器计算标准误差是有代价的。估算器效率不高,标准误差可能很大。获得某些效率的一种方法是在可能的情况下聚类标准错误。

您可以在我上面提到的网站上找到有关此主题的更多详细信息。


12

缺少同质性可能会导致参数的标准误差估计不可靠。参数估计是无偏的。但是估计可能没有效率(不是蓝色)。您可以在以下链接中找到更多内容


12

日志ÿÿβs错误地导致绝对误差的非竞争性总和。有时,缺乏方差恒定性意味着一个更基本的建模问题。

ÿ日志ÿ


1

在其他答案中,尤其是第一个问题时,这里提供了很好的信息。我想我会补充一些有关您最后两个问题的免费信息。

  1. 与异方差相关的问题不仅限于推断。由于它们主要包含不正确的置信区间,p值和预测限制,因此它们适用于整个数据范围。
  2. 4×
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.