解释plot.lm()


Answers:


139

文档所述plot.lm()可以返回6个不同的图:

[1]残差对拟合值的曲线图,[2] sqrt(|残差|)对拟合值的Scale-Location曲线图,[3]普通QQ曲线图,[4] Cook距离与行标签的曲线图,[5]残差对杠杆的作图,[6]库克距离对杠杆/(1-杠杆)的作图。默认情况下,提供前三个和前五个。(我的号码

默认情况下返回图[1][2][3][5]。解释[1]在CV上讨论:解释残差与拟合图,以验证线性模型的假设。我在这里解释了同方差的假设以及可以帮助您评估CV的曲线(包括比例尺曲线[2]):线性回归模型中的恒定方差意味着什么? 我在这里讨论了关于CV的qq-plots [3]QQ图与直方图不匹配,在这里:PP-plots与QQ-plots。这里也有一个很好的概述: 如何解释QQ情节? 因此,剩下的主要只是理解[5],即剩余杠杆图。

要了解这一点,我们需要了解三件事:

  • 杠杆
  • 标准化残差,以及
  • 库克的距离。

(X¯, Y¯)X因为您得到的结果是由几个数据点驱动的;这就是该图旨在帮助您确定的内容。

XX¯X

N

考虑到这些事实,请考虑与四种不同情况相关的图:

  1. 一切正常的数据集
  2. 具有高杠杆率但标准化程度较低的残差点的数据集
  3. 杠杆率低但标准化点残差高的数据集
  4. 具有高杠杆率,高标准化残差的数据集

在此处输入图片说明 在此处输入图片说明

(X¯, Y¯)21

                              leverage std.residual   cooks.d
high leverage,  low residual 0.3814234    0.0014559 0.0000007
low leverage,  high residual 0.0476191    3.4456341 0.2968102
high leverage, high residual 0.3814234   -3.8086475 4.4722437

以下是我用于生成这些图的代码:

set.seed(20)

x1 = rnorm(20, mean=20, sd=3)
y1 = 5 + .5*x1 + rnorm(20)

x2 = c(x1, 30);        y2 = c(y1, 20.8)
x3 = c(x1, 19.44);     y3 = c(y1, 20.8)
x4 = c(x1, 30);        y4 = c(y1, 10)

* 为了帮助您理解OLS回归如何寻求找到使数据和线之间的垂直距离最小的线,请在此处查看我的答案:y上的x线性回归和x上的y线性回归之间有什么区别?


好的答案指出了所有学习的写作方向。(一定想知道为什么对这些地块缺乏如此完整和清晰的解释)
森林生态学家,2015年

尽管是每个图的简要综合说明的示例。
theforestecologist
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.