10倍交叉验证与留一法交叉验证


25

我正在做嵌套的交叉验证。我读过,留一法交叉验证可能有偏见(不记得为什么)。

除了更长的运行时间来进行留一法交叉验证,最好使用10倍交叉验证或留一法交叉验证?


1
你还记得你在哪里读的书吗?
理查德·哈迪

5
您是否看到过有关偏见的帖子?另外,此答案引用了一本非常不错的书的名言,该书建议进行5倍或10倍交叉验证。
埃里克·法恩

1
这篇文章有点相关。
理查德·哈迪

1
谢谢。因此,总而言之,我应该选择10倍CV,而不是一劳永逸的CV?这是否也适用于小型数据集?
机械

1
@Thomas,如果您的数据集变得太小,您最终几乎会做LOO-CV,因此当数据集大小减小时,十倍CV的好处就会减少。
cdeterman

Answers:


27

只是为@SubravetiSuraj(+1)的答案做些微补充

交叉验证会给性能带来一个悲观的偏差估计,因为如果将训练集做得更大,大多数统计模型都会得到改善。这意味着k倍交叉验证估计了在可用数据集的100 *(k-1)/ k%而非100%的数据集上训练的模型的性能。因此,如果您执行交叉验证以评估性能,然后使用针对所有数据训练的模型用于运营,则其性能将比交叉验证估计所建议的稍好。

留一法交叉验证近似无偏,因为每次折叠中使用的训练集与整个数据集之间的大小差异仅是一个模式。伦茨和布雷洛夫斯基(俄语)对此发表了一篇论文。

伦茨,亚历山大·亚历山大和维克多·布雷洛夫斯基。“关于在识别的统计程序中获得的字符的估计。” Technicheskaya Kibernetica 3.6(1969):6-12。

也可以看看

判别分析中的误码率估计Peter A. Lachenbruch和M. Ray Mickey Technometrics Vol。1,pp。10,伊斯 1,1968

但是,尽管留一法交叉验证近似无偏,但它往往具有较高的方差(因此,如果对来自同一分布的不同初始数据样本重复进行估算,则会得到截然不同的估算)。由于估算器的误差是偏差和方差的组合,因此留一法式交叉验证是否优于10倍交叉验证取决于这两个量。

现在,如果将模型拟合到较小的数据集,则拟合模型的方差趋向于更高(因为它对所使用的特定训练样本中的任何噪声/采样伪像更加敏感)。这意味着,如果您只有有限的数据量,则10倍交叉验证可能具有较高的方差(以及较高的偏差),因为训练集的大小将小于LOOCV。因此,k折交叉验证也可能存在方差问题,但原因有所不同。这就是为什么在数据集较小的情况下LOOCV通常更好的原因。

然而,在我看来,使用LOOCV最主要的原因是,它是对某些模型(如线性回归,最核心的方法,最近邻分类等)的计算上更便宜,除非该数据集是非常小的,我会用10倍交叉验证(如果它适合我​​的计算预算,或者更好的是引导估计和装袋)。


2
+1为晦涩的1969年俄罗斯参考!您对LOOCV具有高方差有很好的参考吗?Hastie等人对此进行了说明,但我不确定我是否100%相信该论点,也没有看到经验证明(模拟)。
变形虫说莫妮卡(Monica)恢复职权

3
是的,我认为我并不同意,因为它假定模型在删除测试样本所引起的扰动下是稳定的,只有在您拥有非常大的数据集的情况下,才可能接近真实(即只是渐近为真,但是如果您有那么多数据,几乎任何明智的性能评估方案都可以提供相同的结果)。
迪克兰有袋动物”,

2
+1(帖子和最新评论-很棒的论文,但切勿盲目(与其他论文一样))。
usεr11852恢复单胞菌说,

2
@Dikran这个话题(LOOCV的变化最大)再次出现在一个单独且非常有趣的问题中:stats.stackexchange.com/questions/280665,您可能想看看。
变形虫说恢复莫妮卡

2
ķ

20

我认为,只有少量训练数据时,最好不要进行交叉验证。在这种情况下,您实际上无法做出10折来预测如何使用其余数据来训练模型。

另一方面,如果您有大量的训练数据,那么10倍交叉验证会是更好的选择,因为将有太多的迭代,而不必进行交叉验证,并且考虑到许多结果来调整您的超参数可能不是一个好主意。

根据ISL,在进行留一法和k倍交叉验证之间始终存在偏差方差的折衷。在LOOCV(留出一个CV)中,由于每个训练集都包含n-1个示例,因此可以得到具有较低偏差和较高方差的测试误差估计,这意味着在每次迭代中几乎都使用了整个训练集。这也导致较高的方差,因为训练集之间存在很多重叠,因此测试误差估计值高度相关,这意味着测试误差估计值的平均值将具有较高的方差。

对于k倍CV,情况恰恰相反,因为训练集之间的重叠相对较少,因此测试误差估计值的相关性较小,结果,平均测试误差值不会具有与LOOCV一样大的方差。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.