Answers:
如果您要使用相同的值无限次地复制研究(并且当线性模型为true时),则拟合的回归模型将使用这些参数来生成点估计预测,这是观察到的响应的手段。这些预测值与用于拟合模型的预测值之间的差称为“残差”,当复制数据收集过程时,这些残差具有随机变量的属性,均值为0。
然后将观察到的残差用于随后估计这些值的可变性并估计参数的采样分布。当残差标准误差正好为0时,模型将完美拟合数据(可能是由于过度拟合)。如果不能证明残留标准误差与无条件响应的变异性有显着差异,则几乎没有证据表明线性模型具有任何预测能力。
假设我们有以下ANOVA表(根据R的example(aov)
命令改编而成):
Df Sum Sq Mean Sq F value Pr(>F)
Model 1 37.0 37.00 0.483 0.525
Residuals 4 306.3 76.57
如果将任何变化源(模型或残差)的平方和除以其各自的自由度,则得出均方根。特别是对于残差:
因此76.57是残差的均方值,即响应变量上残差的量(应用模型后)。
您要求的残差标准误差不过是均方误差的正平方根。在我的示例中,残留标准误差等于或大约8.75。R将输出此信息为“关于4个自由度的8.75”。
在“统计学习简介”中非常清楚地解释了RSE。