什么时候不使用交叉验证?


10

当我阅读该站点时,大多数答案都建议交叉验证应在机器学习算法中进行。但是,当我阅读《理解机器学习》一书时,我看到有一种练习,有时最好不要使用交叉验证。我真的很困惑 什么时候对整个数据进行训练算法比交叉验证更好?它是否发生在真实的数据集中?

是k个假设类。假设你是给 IID训练例子,你想学习类^ h = ķ = 1 ^ h 。考虑两种替代方法:H1,...,HkmH=i=1kHi

  1. 使用ERM规则在m个示例中学习Hm

  2. 划分米实例为训练集的大小的和验证组的大小α ,对于一些α ∈ 0 1 。然后,使用验证应用模型选择方法。也就是说,第一个训练每个类ħ 1 - α 使用相对于所述ERM规则训练样例ħ ,并让ħ 1... ħ ķ(1α)mαmα(0,1)Hi(1α)mHih^1,,h^k成为假设。其次,相对于应用该规则ERM到无限类{ ħ 1... ħ ķ }对α 验证的例子。h^1,,h^kαm

描述第一种方法优于第二种方法的情况,反之亦然。

形象的态度


1
这是一个有趣的练习,但是我不同意标签。我认为交叉验证在这里可以完美地完成工作。作为切线,如果您键入练习并将其引用,那么它实际上是首选,而不是附加图像。视力障碍的用户无法访问该图像。
马修·德鲁里

使用交叉验证的一个可能的缺点可能是过度拟合(如省略一个交叉验证的情况)。本质上,通过使用交叉验证技术,我们正在验证数据集(而不是测试数据集)上调整模型的参数。但是有时,在分类器在测试集上进行测试时,此调整可能会做得太多,从而导致过度拟合。
Upendra Pratap Singh

1
“平价”在这里是什么意思?
shadowtalker

@shadowtalker我认为这意味着求和模
2。– SMA.D

您是否区分(重复的)交叉验证和自举?
usεr11852

Answers:


11

带回家的消息:

  • 练习应该告诉您,有时候(取决于您的领域:经常甚至几乎总是)最好不要进行数据驱动的模型优化/调整/选择。

  • 在某些情况下,交叉验证并不是最佳选择,最好的选择是,但这些注意事项与您在这里所从事的工作无关。

  • 不验证(验证,测试)模型永远不是一个好选择。

不幸的是,您引用的文本在方法1和2之间改变了两件事:

  • 方法2执行交叉验证数据驱动的模型选择/调整/优化
  • 方法1既不使用交叉验证,也不使用数据驱动的模型选择/调整/优化。
  • 在此处讨论的上下文中,无需数据驱动的模型选择/调整/优化的方法3交叉验证是完全可行的(恕我直言,恕不另行通知)
  • 方法4,没有交叉验证,但是数据驱动的模型选择/调整/优化也是可能的,但是构造起来更复杂。

恕我直言,交叉验证和数据驱动的优化是设置建模策略时的两个完全不同(且在很大程度上是独立的)决策。该唯一的连接,您可以使用交叉验证估计为目标的功能为您的优化。但是还有其他可用的目标功能,以及交叉验证估计的其他用途(重要的是,您可以将它们用于模型验证,aka验证或测试)

不幸的是,机器学习术语目前是恕我直言的一团糟,这表明这里存在错误的连接/原因/依赖性。

  • 当您查找方法3(不是为了优化而是为了测量模型性能而使用交叉验证)时,您会发现“决策”交叉验证与对整个数据集的训练在这种情况下是错误的二分法:使用交叉验证时为了衡量分类器的性能,将交叉验证的优值用作对在整个数据集上训练的模型的估计。即方法3包括方法1。

  • p模型的参数/系数,但是优化所做的是估计其他参数,即所谓的超参数。如果将模型拟合和优化/调整过程描述为对模型参数的搜索,那么这种超参数优化意味着需要考虑更大的搜索空间。换句话说,在方法1(和3)中,您通过指定那些超参数来限制搜索空间。您的真实世界数据集可能足够大(包含足够的信息)以允许在受限搜索空间内进行拟合,但又不足以在方法2(和4)的较大搜索空间中充分良好地固定所有参数。

实际上,在我的领域中,我经常不得不处理太小的数据集,以至于无法考虑数据驱动的优化。因此,我该怎么办:我使用有关数据和数据生成过程的领域知识来确定哪种模型与数据和应用程序的物理性质完全匹配。在这些之中,我仍然必须限制模型的复杂性。


好答案。我以某种方式希望您能对此线程做出贡献。明显+1
usεr11852

感谢您提供的有益信息。我从您的回答中学到的是,当我们拥有小的数据集时,我们可能会选择方法2,这不是因为验证而是因为模型选择。我对么?对小数据集使用模型选择是否会导致拟合不足?
SMA.D

另一个问题是,在练习中,方法1和方法2的假设类大小相同。在这种情况下,方法2的搜索空间如何更大?
SMA.D

好吧,如果2中有一个选择,而1中没有,那么2中的搜索空间会更大。如果2中的搜索空间不大,则方法2中实际上没有任何选择。我对方法2的含义的回答和解释是由术语“使用验证进行模型选择”触发的。如果上下文仍然是“何时交叉验证会失败”练习之一,那么本书可能意味着我所说的上述方法3,即不涉及模型选择。但是在那种情况下,“模型选择”这个词确实不应该出现。我无法判断如何可能这个..
cbeleites不满SX

……因为我不知道书中关于模型选择的内容,也不知道他们的ERM规则是什么(在我的词汇中,ERM扩展到企业风险管理……)。但是,无论采用哪种建模算法,我的答案都成立。
cbeleites不满意SX
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.