当使用自举进行模型评估时,我一直认为直接购买的样本可以直接用作测试集。但是,对于已弃用的 scikit-learnBootstrap
方法来说似乎不是这种情况,该方法似乎是通过从图纸中提取测试数据来构建测试集,并替换了现成的数据子集。这背后的统计原因是什么?在某些特定情况下,该技术比仅对袋外样本进行评估更好,反之亦然吗?
交叉验证?重采样?
—
EngrStudent 2015年
如果您指的是标签,那不是我添加的。实际上,我正在引导自己来替代CV。
—
gibberfish
我想你误会了。在交叉验证中,他们将对一部分数据重复几次该过程,并查看结果或模型参数的变化。在这种情况下,参数变化本身会表明拟合的质量,而不一定是OOB误差。我对特定的图书馆不熟悉,所以我只对这个想法发表了评论。
—
EngrStudent 2015年