Answers:
选定的答案很棒,但我想补充两点:
如果我们的意思是根据先前事件的知识按顺序预测下一个事件,则存在最佳预测的基本理论。Solomonoff预测(Solomonoff 1964)在几种意义上证明是最优的,包括“将学会只用绝对的最小数据量就可以正确预测任何可计算序列”。(Hutter,Legg和Vitanyi,2007年)Solomonoff预测器根据Kolmogorov程序的复杂度和程序迄今为止分配给数据的概率,对所有与现有数据兼容的程序进行加权,并结合Epicurean(“保留所有理论”)和贝叶斯框架中的Ockham(“首选简单理论”)哲学。
Solomonoff预测的最优属性解释了您所引用的可靠发现:对模型,源或专家进行平均可以改善预测,并且平均预测甚至比最佳单个预测值还要好。在实践中看到的各种合奏方法可以看作是Solomonoff预测的可计算近似值-像MML(Wallace 2005)这样的方法明确地探索了这种联系,尽管大多数不是这样。
Wallace(2005)指出,所罗门诺夫(Solomonoff)预测变量不是简约的-它拥有无限的模型库-但大多数预测能力不可避免地属于相对较小的一组模型。在某些领域中,单个最佳模型(或几乎无法区分的模型家族)可能会占很大一部分预测能力,并且胜过一般合奏,但在理论很少的复杂领域中,很可能没有哪个家族能获得大部分后验概率,因此,对合理的候选者进行平均可以改善预测。为了赢得Netflix奖,Bellkor团队融合了450多种模型(Koren,2009年)。
人类通常会寻求一个很好的解释:在诸如物理学之类的“高理论”领域中,它们很好地起作用。的确,如果它们抓住了潜在的因果动力,那么它们几乎是无与伦比的。但是,在可用的理论与现象(例如电影推荐或地缘政治)不完全吻合的情况下,单个模型将表现不佳:所有模型都不完整,因此任何模型都不应占主导地位。因此,最近的重点是合奏(用于机器学习)和人群的智慧(用于专家),以及IARPA ACE等计划的成功,尤其是Good Judgment Project(Tetlock和Gardiner,2015年)。