最近,我遇到了一篇论文,提出在特定数据集上使用k-NN分类器。作者使用所有可用的数据样本对不同的k值执行k倍交叉验证,并报告最佳超参数配置的交叉验证结果。
据我所知,这个结果是有偏差的,他们应该保留一个单独的测试集,以获取未用于执行超参数优化的样本的准确性估计。
我对吗?您能否提供一些参考(最好是研究论文)来描述交叉验证的这种滥用?
3
请注意,可以使用所谓的嵌套交叉验证来代替单独的测试集。如果您在此站点上搜索此术语,则会发现很多讨论。尤其要寻找@DikranMarsupial的答案,他是公认答案中引用的第二篇论文的作者之一。
—
变形虫说恢复莫妮卡