Answers:
交叉验证实验的结果可以告诉您,支持向量机在数据上的性能优于朴素贝叶斯,或者对于该特定数据集,分类器的超级参数应设置为c。掌握了这些知识之后,您便可以使用所有可用数据来训练“生产”分类器,并将其应用于您的问题。
在许多情况下,甚至还不清楚如何平均几个模型。例如,三个决策树或最近邻居分类器的平均值是多少?
重要的是要记住,交叉验证的结果是估计值,而不是保证值,如果生产分类器使用相似质量(和数量)的数据进行训练,则这些估计更有效。在开发使用这些估计来进行推断的方法方面,已经进行了大量的工作。也就是说,就统计数据而言,在这些数据上,方法A通常优于方法B。