原始残差与标准残差与学生残差-何时使用?


31

看起来像一个类似的问题,没有得到很多答复。

省略了Cook的D之类的测试,而只是将残差作为一个整体来看,我对其他人在评估拟合优度时如何使用残差感兴趣。我使用原始残差:

  1. 在QQ图中,用于评估正态性
  2. 在与残差的散点图中,用于(a)异方差和(b)序列自相关的眼球检查。y

为了绘制与残差的关系以检查可能出现异常值的值,我更喜欢使用学生化残差。我偏爱的原因是,尽管标准化残差提供了极为相似的结果,但它允许轻松查看存在问题的残差。我的理论是,这取决于一所大学。yyy

这类似于其他人使用残差的方式吗?其他人会结合摘要统计使用此数量的图吗?


3
学生化的残差无疑在检测异常值方面更好,并且在异方差检查中也许更好。出于其他目的,使用什么残差对我来说没有什么区别。
ttnphns 2012年

要引起某个问题(米歇尔)的注意或要求更改其状态(例如CW),请点击问题下方的“标志”链接。这将自动通知所有主持人。在问题,评论或答复中嵌入请求是命中注定的,因为这取决于希望主持人(或其他高级用户)在合理的时间内实际阅读请求的希望!
ub

@whuber啊,看,我确实认为你们当中的一个会最终阅读它。:)感谢您使用标志的提示。
米歇尔2012年

1
嗨@ttnphns他们为什么会更好?特别是为什么学生化要比标准化好?(我从这里从未真正知道答案)
彼得·弗洛姆(Peter Flom)-恢复莫妮卡(Monica)

4
@Peter,学生化残差在OLS拟合算法中较少“失真”,而更接近于“错误”的理论概念。可以在拟合线的不同区域直接比较它们,因此,如果某个点是异常值,则可以更好地进行决策。
ttnphns

Answers:


8

这并不是对术语的澄清,而是答案。您的问题询问原始残差,标准化残差和学生残差。但是,这不是大多数统计学家使用的术语,尽管我注意到您的课堂笔记指出确实如此。

原始:和您一样。

标准化:这实际上是原始残差除以残差的真实标准偏差。由于很少知道真正的标准偏差,因此几乎不会使用标准化残差。

内部学习:由于通常不知道残差的真实标准偏差,因此将使用估计的标准偏差。这是一次学生间的残差,这就是您所说的标准化残差。

外部学生化:与内部学生化残差相同,但残差标准偏差的估计是通过回归计算得出的,而忽略了所讨论的观测值。

皮尔逊(Pearson):原始残差除以响应变量(y变量)的标准偏差,而不是残差的标准差。您没有列出此列表。

“留一个”:没有正式名称,但与课程注释相同。

标准化的“遗漏”:也没有正式名称,但这不是班级笔记所说的学生化名称。

资料来源:

  1. 关于学生化残差的相同Wiki链接(“学生化残差是将残差除以标准差的估计所得的商”)

  2. SAS中用于残差计算的文档


2
+1当然,某些统计学家在OP的问题中使用了这些用语(并不总是与使用相同词的其他人完全一致)。我认为您使用的术语正在变得越来越普遍,但是我不确定我们可以基于什么基础猜测统计学家在全球范围内的使用情况,例如,论文不一定会有所帮助,因为一般的统计学家不会积极参与出版。您可能是对的-但是我们怎么知道呢?[如果碰巧再次进行编辑,则可能要在结尾处将“标准”替换为“标准”。]
Glen_b-恢复莫妮卡2014年

2

回复:情节,

存在过度拟合的问题,但是过度绘图实际上并不会造成太大的危害,尤其是在诊断阶段。标准化的正态概率图不会伤害您的QQ图。我发现最好评估分布的中间值。

回复:残差,

我在草稿阶段同时运行标准化残差和学生化残差,并且通常最终对标准化残差进行编码。我不知道其他人实际上在运行什么,因为诊断实际上是在我在线找到的复制资料中写下的。

回复:诊断,

对于线性模型,我通常添加方差膨胀因子(使用vifStata中的命令)和一些均方差检验(例如,使用hettestStata中的命令),以及使用嵌套回归的模型分解来检查是否有意义。R2

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.