我发现交叉验证(CV)统计信息和与线性模型(具有正态,均等误差向量)。
一方面,Golub,Heath和Wahba将GCV估计为(p。216)
给出的 V \ left(\ lambda \ right)的极小值= \ frac {\ frac {1} {n} \ left \ | \ left(I-A \ left(\ lambda \ right)\ right)y \ right \ | ^ 2} {\ left(\ frac {1} {n} \ mathrm {tr} \ left(I-A \ left(\ lambda \ right)\ right)\ right )^ 2}
其中
另一方面,埃夫隆(Efron)定义了与V \ left(0 \ right)相同的概念(第24页),但他将此概念的引入归因于Craven&Wahba,其定义(第377页)基本相同如Golub,Heath&Wahba的上述定义。
这是否意味着使V \ left(\ lambda \ right)最小化?
类似地,Golub,Heath和Wahba将\ lambda的CV估计值定义为(p。217)作为
其中是估算值
的与个数据点删去。
作者将CV估算(也称为PRESS估算)的引入归因于Allen(同上,“ Allen PRESS”)。然而,在Allen的论文中,PRESS估算定义为(p。126)为(在Efron的文章中定义为(第24页))。
同样,这是否意味着最小化?
Allen,DavidM。变量选择与数据参数化之间的关系以及一种预测方法。技术计量学,卷。第16号,第1号(1974年2月),第125-127页
Craven,Peter和Wahba,Grace。使用样条函数平滑噪声数据。Numerische Mathematik 31,(1979),第377-403页
埃弗隆·布拉德利。Logistic回归的表观错误率有多高?技术报告编号 232.斯坦福大学统计系(1985年4月)
Golub,Gene H.,Heath和Grace Wahba。广义交叉验证作为一种选择良好岭参数的方法。技术计量学,卷。21,No.2(1979年5月),第215-223页