什么是残留标准误差?


35

在R中运行多元回归模型时,输出之一是在95,161自由度上的残留标准误差0.0589。我知道95161自由度是由样本中的观察数与模型中的变量数之差得出的。残留标准误差是多少?


2
这个问题及其答案可能会有所帮助:为什么我们说残留标准误差?
Antoine Vernet

一个简单的问题:“残留标准偏差”与“残留标准偏差”相同吗?Gelman和Hill(p.41,2007)似乎可以互换使用。
JetLag

Answers:


26

如果您要使用相同的值无限次地复制研究(并且当线性模型为true时),则拟合的回归模型将使用这些参数来生成点估计预测,这是观察到的响应的手段。这些预测值与用于拟合模型的预测值之间的差称为“残差”,当复制数据收集过程时,这些残差具有随机变量的属性,均值为0。X

然后将观察到的残差用于随后估计这些值的可变性并估计参数的采样分布。当残差标准误差正好为0时,模型将完美拟合数据(可能是由于过度拟合)。如果不能证明残留标准误差与无条件响应的变异性有显着差异,则几乎没有证据表明线性模型具有任何预测能力。


3
这可能已经回答过了。查看此问题是否提供您需要的答案。[R的LM解读()输出] [1] [1]:stats.stackexchange.com/questions/5135/...
doug.numbers

26

假设我们有以下ANOVA表(根据R的example(aov)命令改编而成):

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

如果将任何变化源(模型或残差)的平方和除以其各自的自由度,则得出均方根。特别是对于残差:

306.34=76.57576.57

因此76.57是残差的均方值,即响应变量上残差的量(应用模型后)。

您要求的残差标准误差不过是均方误差正平方根。在我的示例中,残留标准误差等于或大约8.75。R将输出此信息为“关于4个自由度的8.75”。76.57


1
我赞成@AdamO的答案,因为作为一个最经常直接使用回归的人,该答案对我来说是最直接的。但是,我很欣赏这个答案,因为它说明了方差分析与线性回归之间的符号/概念/方法上的关系。
svannoy

12

ÿ=β0+β1个X+ϵ
ϵX

β0β1个ϵϵ

在“统计学习简介”中非常清楚地解释了RSE。


2
ϵ[R小号Ë=[R小号小号ñ-2

1
对于阅读ISL的epub的任何人,您都可以通过ctrl -f“残余标准错误”找到“第66页”。(Epub文件没有真实的页码)。
user2426679
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.