很大程度上取决于规模。我希望我可以指望拥有超过2,000-3,000个类似@RyanZotti的案例;我很少有那么多的1/10。在“大数据”机器学习人员和从事生物医学等领域工作的人员之间,这是一个很大的观点差异,这可能解释了您在本网站上会发现的一些不同观点。
我将对我对这个问题的看法进行启发式解释。如Wikipedia页面所述,过度拟合的基本问题是案例数与您要评估的参数数之间的关系。因此,从一个粗略的想法开始,如果您有M个模型,则在每个模型中选择p个参数,然后在每个模型中选择p个参数,那么总的来说,您将在Mp个参数的顺序上进行评估。
如果存在过度拟合的危险,则有两种通用方法可以拉回到更通用的模型:减少参数数量或以某种方式惩罚它们。
有了足够大的数据集,您可能永远都不会接近过拟合。如果您有20,000个案例,并且有20个不同的模型,每个模型具有100个参数,那么即使没有惩罚也可能不会遇到麻烦,因为每个有效参数仍然有10个案例。不要只用200个案例尝试这种建模策略。
模型平均可能被认为是一种惩罚形式。在@RyanZotti引用的Kaggler的示例中,案例的数量大概是巨大的,并且最终合奏中的“数千”模型中的每一个仅分别占最终模型的一小部分。特定于特定贡献模型的任何过度拟合都不会对最终结果产生很大影响,而Kaggler竞赛中的大量案例进一步降低了过度拟合的危险。
因此,与这里的许多问题一样,唯一合理的答案是:“取决于情况”。在这种情况下,它取决于案件数量与所检查参数的有效数量之间的关系,以及所施加的惩罚程度。