Answers:
不能保证。就像您说的那样,合奏可能比单个模型差。例如,取真实模型和不良模型的平均值将得出一个相当不良的模型。
如果模型(某种程度上)相互独立,则模型的平均值只会有所改善。例如,在装袋中,每个模型都是从数据的随机子集构建的,因此内置了一些独立性。或者可以使用特征的不同组合构建模型,然后通过平均进行组合。
而且,只有在各个模型具有较高方差时,模型平均才可以很好地发挥作用。这就是为什么使用非常大的树木建造随机森林的原因。另一方面,对一堆线性回归模型求平均仍会得到一个线性模型,这可能不会比开始时的模型要好(尝试!)
其他合奏方法(例如增强和混合)通过将各个模型的输出以及训练数据作为更大模型的输入来工作。在这种情况下,它们通常比单个模型更好地工作就不足为奇了,因为它们实际上更复杂,并且仍然使用训练数据。
我只想提出一些在这种情况下很少讨论的内容,它应该给您带来思考的空间。
合奏也可以与人类合作!
已经观察到,对人类预测进行平均比任何单个预测提供更好的预测。这被称为人群的智慧。
现在,您可能会争辩说这是因为某些人拥有不同的信息,所以您实际上是在平均信息。但是不,即使对于诸如猜测罐子中的豆子数量之类的任务也是如此。
有很多关于此的书籍和实验,这种现象仍然困扰着研究人员。
就像@Flounderer指出的那样,真正的收益来自诸如决策树之类的所谓不稳定模型,其中每个观察结果通常都会对决策边界产生影响。像SVM这样的更稳定的采样不会获得太多收益,因为重新采样通常不会对支持向量产生太大影响。