为什么说“残留标准误差”？

14

标准误差是估计的标准偏差的估计的为参数。 $\hat \sigma(\hat\theta)$ $\hat\theta$ $\theta$

为什么将残差的估计标准偏差称为“残差标准误差”（例如，在R summary.lm函数的输出中）而不称为“残差标准差”？我们在此为什么参数估计配备标准误差？

我们是否将每个残差都视为“其”误差项的估计量，并估计所有这些估计量的“合并”标准误差？

r standard-error residuals terminology

— 迈克尔·M
source

6

我认为这是R的事情。我认为其他软件不一定使用这种措词，例如，“残余标准偏差”在教科书中很常见。我没有答案，但我一直认为R使用该短语很奇怪。

— gung-恢复莫妮卡

@gung：这可能是解释！当在报价单中搜索“残差标准错误”时，我得到的点击率只有没有报价时的0.1％...

— Michael M

如果您愿意，我可以将其作为（非）答案。

— gung-恢复莫妮卡

1

@gung有趣的是，使用特定软件如何影响您的思维：我永远不会称其为“残余sd”-残余不是数据而是错误，因此残余错误似乎是正确的名字。但是，如果您考虑一下，那确实是一件R事。

— 蒂姆

2

@Tim，可以正确地认为是误差的标准偏差的估计，但是从技术上讲，残差本身并不是误差。这也不是错误SD的标准错误，这是值得的。

— gung-恢复莫妮卡

12

我认为措词特定于R的summary.lm()输出。请注意，基础值实际上称为“ sigma”（summary.lm()$sigma）。我认为其他软件不一定会使用该名称作为残差的标准偏差。另外，短语“残余标准偏差”在教科书中很常见。我不知道这是R的summary.lm()输出中使用的措词，但我一直认为这很奇怪。

— gung-恢复莫妮卡
source

如何summary.lm(reg)$sigma不同sd(reg$residuals)？

— 空袭

3

@AndréTerra，正确的自由度是n-p，即摘要所使用的自由度。sd使用var，它使用n-1个自由度。如果您手动计算残差的标准偏差除以n-p，那么您将得到与汇总提供的答案相同的答案。

— Jdub

3

为了证实这一点，我从R文档中引用stats::sigma：错误的“残余标准误差”已成为太多R（和S）输出的一部分，无法在此处轻松更改。

— NRH

2

在我的计量经济学培训中，它被称为“残差标准误差”，因为它是对实际“残差标准差”的估计。请参阅证实该术语的相关问题。

在Google中搜索“残留标准误差”一词也显示了很多匹配，因此绝不是R的奇数。我用引号尝试了这两个词，它们都出现了大约60,000次。

— 海森堡
source

有趣。但是，为什么将任何随机变量（例如误差项；而不是特定估计量）的标准偏差的估计称为“标准误差”呢？

— Michael M

我的想法是，我们需要为估算值起一个名字（以区别于实际值），任何名字都一样。但是可以肯定的是，对词源学知识更深的人可以提供更好的理由。请注意，绝对与系数标准误差平行，这是系数估计的标准偏差的估计。

— 海森堡

0

简而言之，样本的标准误差是对样本均值可能与总体均值相差多少的估计，而样本的标准差是样本中个体与样本均值的差异程度。

标准错误-维基百科，免费的百科全书

— 用户名
source

6

的确如此，但实际上并不能回答问题。R所说的“残差标准误差”不是“估计样本均值可能与总体均值有多远”。

— gung-恢复莫妮卡

0

如果您要使用相同的XX值无限次地复制研究（当线性模型为true时），则拟合的回归模型将使用这些参数来生成点估计预测，这是观察到的响应的手段。

这些预测值与用于拟合模型的预测值之间的差称为“ 残差 ”，当复制数据收集过程时，其残差属性具有均值为0的随机变量。然后将观察到的残差用于随后估计这些值的可变性并估计参数的采样分布。

注意：

当残差标准误差正好为0时，模型将完美拟合数据（可能是由于过度拟合）。

如果不能证明残余标准误差与无条件响应的变异性有显着差异，则几乎没有证据表明线性模型具有任何预测能力。

— 阿比舍克（Abhishek Jaiswal）
source