根据我正在使用的文本,第残差的方差公式为:
我发现这难以置信,因为第残差是第观测值与第拟合值之间的差。如果要计算差异的方差,那么至少我会期望结果表达式中有些“加”。任何理解推导的帮助将不胜感激。
根据我正在使用的文本,第残差的方差公式为:
我发现这难以置信,因为第残差是第观测值与第拟合值之间的差。如果要计算差异的方差,那么至少我会期望结果表达式中有些“加”。任何理解推导的帮助将不胜感激。
Answers:
关于“加号”的直觉与方差有关(即使我们计算独立随机变量差的方差,我们也要加上它们的方差)是正确的,但致命的是不完整的:如果所涉及的随机变量不是独立的,则还涉及协方差-并且协方差可能为负。存在一个表达式,几乎就像问题中的表达式被OP(和我)认为是“应该”那样,并且它是预测误差的方差,表示为,其中:Ŷ 0 = β 0 + β 1 X 0 + Ü 0
预测误差的方差与估计误差的方差(即残差)之间的关键差异在于,由于在构造时未使用值y 0,因此预测观测值的误差项与估计量不相关。估算器并计算估算值,即样本外值。
两者的代数以完全相同的方式进行到一个点(使用0而不是i),但随后发散。特别:
在简单的线性回归,瓦尔(Ù 我)= σ 2,的估计方差β = (β 0,β 1 )'仍然
我们有
所以
我们有
所以
意思就是
第个残差定义为
实际系数被视为常数,回归量是固定的(或条件在其上),并且具有零协方差与误差项,但该估计与误差项相关,因为估计含有因变量,以及因变量包含错误项。所以我们有
打包一点以获得
在大括号中的项具有完全相同的结构与预测误差的变化,唯一的变化是,与其,我们将有X 0(和方差将是该Ë 0,而不是ü我)。最后协方差项为预测误差为零,因为ÿ 0,因此Ü 0是不包括在所述估计的,但不是零的估计误差,因为ÿ 我因此Ü 我是样品的一部分,并且因此被包括在估算器。我们有
从如何最后一个换人β 0计算。继续,
将其插入残差方差的表达式中,我们得到
因此,不妨讨论一下OP正在使用的文本。
(我已经跳过了一些代数运算,难怪这几天OLS代数的学习越来越少了……)
一些直觉
因此看来,预测时对我们有用(方差较大),估计时对我们有用(方差较小)。这是一个很好的起点,可以用来思考为什么出色的拟合度可能对模型的预测能力不利(尽管这听起来有点违反直觉)。
我们正在估算回归变量的期望值,这一事实将方差减小了。为什么?因为通过估算,我们对样本中存在的某些误差变化 “视而不见” ,因为我们本质上是估算期望值。而且,更大回归变量的观测值与回归变量样本均值之间的偏差,与该观测值相关的残差方差越小 ……观测值越偏离,其残差越小……这是回归变量的变异性通过“取代”未知的错误可变性为我们工作。
但这对估计是有好处的。对于预测,同样的事情也不利于我们:现在,通过不考虑的可变性(尽管有欠完善)(因为我们要进行预测),我们从样本中获得的不完美估计量显示出它们的弱点:我们估计了样本意思是,我们不知道真正的期望值-方差会增加。我们有一个X 0是远离从其他观察-too不好计算样本均值,我们的预测误差方差得到另一个提振,因为预测ÿ 0 将会趋于误入歧途...用更科学的语言“从减少预测误差方差的意义上讲,最佳预测变量代表着向预测变量均值的缩小 ”。我们不尝试复制因变量的可变性-我们只是尝试保持“接近平均值”。
Sorry for the somewhat terse answer, perhaps overly-abstract and lacking a desirable amount of intuitive exposition, but I'll try to come back and add a few more details later. At least it's short.
Given ,
因此
在简单的线性回归的情况下...这给出了问题的答案。
这个答案也很有意义: 与...成正相关 ,则差异的方差应小于方差之和。
-
编辑:为什么的解释 是幂等的。
(一世) 是幂等的:
(ii)