LOOCV公式的证明


18

根据James等人的《统计学习入门》,留一法交叉验证(LOOCV)估计值定义为 其中。

CV(n)=1ni=1nMSEi
MSEi=(yiy^i)2

没有证据,方程式(5.2)指出,对于最小二乘或多项式回归(我是否只适用于仅对一个变量进行回归), 其中“为在从原来的最小二乘个拟合值拟合(不知道的方式这意味着什么,,它使用意味着所有数据集?点)和是杠杆作用”,这是由定义ÿ

CV(n)=1ni=1n(yiy^i1hi)2
y^iihi
hi=1n+(xix¯)2j=1n(xjx¯)2.

如何证明这一点?

我的尝试:首先可以注意到 但分开由此(如果我还记得,公式仅适用于简单的线性回归...),我不确定如何从此处继续。ħ

y^i=β0+i=1kβkXk+some polynomial terms of degree 2
hi

您的方程式似乎将用于不止一件事,或者我感到非常困惑。无论哪种方式,额外的清晰度都将是好的。i
Glen_b-恢复莫妮卡

@Glen_b我昨天才刚刚了解LOOCV,所以我可能无法正确理解某些内容。据我了解,您有一组数据点,例如。使用LOOCV,对于每个固定(正整数),您都有一些验证集和测试集用于为每个生成拟合模型。举例来说,例如,我们使用具有三个数据点简单线性回归拟合模型。我们将会(待续)ķ V ķ = { X ķÿ ķ} Ť ķ = XV ķ ķ X = { 0 1 1 2 2 3 }X={(xi,yi):iZ+}kVk={(xk,yk)}Tk=XVkkX={(0,1),(1,2),(2,3)}
单簧管

@Glen_b和。使用,我们可以发现,使用简单的线性回归可以得到模型。然后我们使用作为验证集来计算并得到(仅使用给定的点)和,给出。好的,也许使用上标不是最好的主意-我将在原始帖子中对此进行更改。 Ť 1 ={1223} Ť 1 Ŷ =X+1MSE V 1 Ŷ 1 =1个 Ÿ 1 1 =0+1=1 MSE 1 =0V1={(0,1)}T1={(1,2),(2,3)}T1y^i=X+1MSEV1y1=1y^1(1)=0+1=1MSE1=0
单簧管

Answers:


17

无论回归变量是否为多项式,我都会显示任何多元线性回归的结果。实际上,它显示的内容远远超出您的要求,因为它表明每个LOOCV残差都与完全回归中相应的杠杆加权残差相同,而不仅是您可以获得(5.2)中的LOOCV误差(还有即使平均值中的每个术语都不相同,也可能是平均值达成一致的其他方式)。Xt

让我自由使用稍微修改的符号。

我们首先表明, β 其中, β是使用所有数据和所述估计 β留出时估计X,观察。让X被定义为行向量,使得 ý=X βü牛逼是残差。

β^β^(t)=(u^t1ht)(XX)1Xt,(A)
β^β^(t)X(t)tXty^t=Xtβ^u^t

证明使用以下矩阵代数结果。

为非奇异矩阵,b为矢量,λ为标量。如果 λAbλ然后 +λbb'-1

λ1bA1b
(A+λbb)1=A1(λ1+λbA1b)A1bbA1(B) 

证明

{A1(λ1+λbA1b)A1bbA1}(A+λbb)=I.

以下结果有助于证明(A)

(X(t)X(t))1Xt=(11ht)(XX)1Xt. (C)

通过(B),我们有,使用:(C)的证明X ' X - 1t=1TXtXt=XX 因此我们发现 X ' 牛逼 X牛逼-1X ' 牛逼

(X(t)X(t))1=(XXXtXt)1=(XX)1+(XX)1XtXt(XX)11Xt(XX)1Xt.
(X(t)X(t))1Xt=(XX)1Xt+(XX)1Xt(Xt(XX)1Xt1Xt(XX)1Xt)=(11ht)(XX)1Xt.

XXβ^=Xy,
(X(t)X(t)+XtXt)β^=X(t)y(t)+Xtyt,
{Ik+(X(t)X(t))1XtXt}β^=β^(t)+(X(t)X(t))1Xt(Xtβ^+u^t).
β^=β^(t)+(X(t)X(t))1Xtu^t=β^(t)+(XX)1Xtu^t1ht,

ht=Xt(XX)1XtXtytu^(t)β^(t)ytXtβ^(t)

u^(t)=u^t+(u^t1ht)ht
u^(t)=u^t(1ht)+u^tht1ht=u^t1ht

X(t)XXŤ

XX=Ť=1个ŤXŤXŤ

@mpiktas,是的,谢谢你的指导。我进行了编辑,以考虑到第一个评论。第二个帮助到底在哪里?或者只是在您的评论中留下?
Christoph Hanck

3
XŤXŤ-1个=XX-XŤXŤ-1个

1
两年后...现在,我已经完成了研究生级别的线性模型序列,我对这个答案更加满意。我正在以这种新视角重新学习这些材料。您是否有任何建议的参考文献(教科书?),这些参考文献都像您在本答案中的详细介绍一样经过推导?
单簧管手
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.