标准误差是估计的标准偏差σ(θ)的估计的θ为参数θ。
为什么将残差的估计标准偏差称为“残差标准误差”(例如,在R summary.lm
函数的输出中)而不称为“残差标准差”?我们在此为什么参数估计配备标准误差?
我们是否将每个残差都视为“其”误差项的估计量,并估计所有这些估计量的“合并”标准误差?
标准误差是估计的标准偏差σ(θ)的估计的θ为参数θ。
为什么将残差的估计标准偏差称为“残差标准误差”(例如,在R summary.lm
函数的输出中)而不称为“残差标准差”?我们在此为什么参数估计配备标准误差?
我们是否将每个残差都视为“其”误差项的估计量,并估计所有这些估计量的“合并”标准误差?
Answers:
我认为措词特定于R的summary.lm()
输出。请注意,基础值实际上称为“ sigma”(summary.lm()$sigma
)。我认为其他软件不一定会使用该名称作为残差的标准偏差。另外,短语“残余标准偏差”在教科书中很常见。我不知道这是R的summary.lm()
输出中使用的措词,但我一直认为这很奇怪。
summary.lm(reg)$sigma
不同sd(reg$residuals)
?
stats::sigma
:错误的“残余标准误差”已成为太多R(和S)输出的一部分,无法在此处轻松更改。
简而言之,样本的标准误差是对样本均值可能与总体均值相差多少的估计,而样本的标准差是样本中个体与样本均值的差异程度。
如果您要使用相同的XX值无限次地复制研究(当线性模型为true时),则拟合的回归模型将使用这些参数来生成点估计预测,这是观察到的响应的手段。
这些预测值与用于拟合模型的预测值之间的差称为“ 残差 ”,当复制数据收集过程时,其残差属性具有均值为0的随机变量。然后将观察到的残差用于随后估计这些值的可变性并估计参数的采样分布。
当残差标准误差正好为0时,模型将完美拟合数据(可能是由于过度拟合)。
如果不能证明残余标准误差与无条件响应的变异性有显着差异,则几乎没有证据表明线性模型具有任何预测能力。