什么时候不使用交叉验证?
当我阅读该站点时,大多数答案都建议交叉验证应在机器学习算法中进行。但是,当我阅读《理解机器学习》一书时,我看到有一种练习,有时最好不要使用交叉验证。我真的很困惑 什么时候对整个数据进行训练算法比交叉验证更好?它是否发生在真实的数据集中? 让是k个假设类。假设你是给米 IID训练例子,你想学习类^ h = ∪ ķ 我= 1 ^ h 我。考虑两种替代方法:H1个,。。。,HķH1,...,HkH_1,...,H_k米mmH= ∪ķ我= 1H一世H=∪i=1kHiH=\cup^k_{i=1}H_i 使用ERM规则在m个示例中学习HHH米mm 划分米实例为训练集的大小的和验证组的大小α 米,对于一些α ∈ (0 ,1 )。然后,使用验证应用模型选择方法。也就是说,第一个训练每个类ħ 我在(1 - α )米使用相对于所述ERM规则训练样例ħ 我,并让ħ 1,... ,ħ ķ(1 - α )米(1−α)m(1−\alpha)mα 米αm\alpha mα ∈ (0 ,1 )α∈(0,1)\alpha\in(0,1)H一世HiH_i(1−α)m(1−α)m(1−\alpha)mHiHiH_ih^1,…,h^kh^1,…,h^k\hat{h}_1,\ldots,\hat{h}_k成为假设。其次,相对于应用该规则ERM到无限类{ ħ 1,... ,ħ ķ }对α 米验证的例子。h^1,…,h^kh^1,…,h^k\hat{h}_1,\ldots,\hat{h}_kαmαm\alpha m 描述第一种方法优于第二种方法的情况,反之亦然。 形象的态度。