乐观偏差-预测误差的估计


9

《统计学习的元素》(在线提供PDF版本)讨论了最佳偏差(7.21,第229页)。它指出,乐观偏差是训练误差与样本误差(如果我们在每个原始训练点采样新的结果值时观察到的误差)之间的差(见下)。

在此处输入图片说明

接下来,它声明这种乐观偏差()等于我们的估计y值与实际y值的协方差(公式如下)。我很难理解为什么这个公式表示乐观偏见。天真的,我会认为实际与预测之间的强协方差仅描述准确性,而不是乐观。让我知道是否有人可以帮助您推导公式或分享直觉。 ωyy

在此处输入图片说明


非常有帮助,谢谢!我认为其中一个方程有一个较小的错字,应该是:=1Ni=1N(Ey[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])
Sleepster

Answers:


8

让我们从直觉开始。

使用预测并没有错。实际上,不使用它意味着我们将丢弃有价值的信息。但是,我们越依赖于包含的信息来得出我们的预测,我们的估算器将越过乐观yiy^iyi

在一个极端情况下,如果仅为,则您将具有完美的样本预测(),但我们可以肯定的是,样本外预测会很糟糕。在这种情况下(您很容易自己检查),自由度将为。y^iyiR2=1df(y^)=n

另一方面,如果对所有使用的样本均值:,则您的自由度将仅为1。yyi=yi^=y¯i

查看Ryan Tibshirani的这份精美讲义,了解有关此直觉的更多详细信息


现在与其他答案类似,但有更多解释

请记住,根据定义,平均乐观度是:

ω=Ey(Errinerr¯)

=Ey(1Ni=1NEY0[L(Yi0,f^(xi)|T)]1Ni=1NL(yi,f^(xi)))

现在使用二次损失函数并展开平方项:

=Ey(1Ni=1NEY0[(Yi0y^i)2]1Ni=1N(yiy^i)2))

=1Ni=1N(EyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

使用来替换:EyEY0[(Yi0)2]=Ey[yi2]

=1Ni=1N(Ey[yi2]+Ey[yi^2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

=2Ni=1N(E[yiy^i]Ey[yi]Ey[y^i])

最后,请注意,得出:Cov(x,w)=E[xw]E[x]E[w]

=2Ni=1NCov(yi,y^i)

5
我必须指出,他的名字拼写为“ Ryan Tibshirani” Rob Tibshirani
robert tibshirani

2
欢迎来到我们的网站,Rob,很荣幸能将您带到这里,只是为了纠正错误!如果您看到更多内容,请告知我们:当然,我们很高兴收到您(或您的学生)可能想发布的任何答案。您的工作在此站点上得到了广泛引用,尤其是ESLBootstrap简介。
ub

介意吗?此外,是吗?EyEY0[(Yi0)2]=Ey[yi2]2EyEY0[Yi0y^i]=2Ey[EY0[Yi0]EY0[y^i]]=2Ey[yi]Ey[y^i]
肖基

7

让,然后 f^(xi)=y^i

ω=Ey[op]=Ey[Errinerr¯]=Ey[Errin]Ey[err¯]=Ey[1Ni=1NEY0[L(Yi0,f^(xi))]Ey[1Ni=1NL(yi,f^(xi))]=1Ni=1NEyEY0[(Yi0y^i)2]Ey[(yiy^i)2]=1Ni=1NEyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=1Ni=1NEy[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=2Ni=1NEy[yiy^i]Ey[yi]Ey[y^i]=2Ni=1NEy[yiy^iyiEy[y^i]Ey[yi]y^i+Ey[yi]Ey[y^i]]=2Ni=1NEy[(y^iEy[y^i])([yiEy[yi])]=2Ni=1Ncov(y^i,yi)
优质教育

1
通过协方差的此属性可以简化最后四个步骤:E[xw]E[x]E[w]=Cov(x,w)
cd98 2016年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.