简约应该真的仍然是黄金标准吗?


31

只是一个想法:

简约模型一直是模型选择的默认选择,但是这种方法在多大程度上已经过时了?我对我们的简约化趋势多少是一次算盘和滑动规则(或更确切地说,是非现代计算机)的遗迹感到好奇。当今的计算能力使我们能够构建越来越复杂的模型,并且具有越来越强大的预测能力。由于计算能力不断提高的上限,我们是否真的仍然需要趋向于简化?

当然,更简单的模型更易于理解和解释,但是在数据量不断增长,变量数量越来越多,并且转向更加关注预测能力的时代,这可能甚至不再可能实现或不必要。

有什么想法吗?


4
向Richard Hamming道歉:建模的目的是洞察力,而不是数字。复杂的模型妨碍洞察力。
埃里克·塔

12
过于简化的模型甚至会进一步阻碍洞察力。
弗兰克·哈雷尔

6
它可能取决于应用程序;在物理学中,我认为关于简约性的论点将有很强的依据。但是,许多应用程序会产生许多无法消除的小影响(例如,考虑政治偏好模型)。许多工作人员建议使用正则化(例如导致缩小或在许多应用中缩小差异或同时缩小两者的方法)比消除变量更有意义;其他则倾向于选择和缩小(例如,LASSO两者都做)。
Glen_b-恢复莫妮卡2015年

3
简约模型不是模型选择中的“首选”。否则,我们将始终使用样本均值对所有事物建模,并将其称为一天。
shadowtalker

1
此外,还有一些值得深思的地方:Mease和Wyner(2008)在AdaBoost中推荐了更丰富的学习者,这有点不直观。在这一研究领域中,一个开放的问题似乎是,简约的基础学习者是否真的导致了简约的合奏。
shadowtalker

Answers:


25

@Matt的原始答案在描述简约性的好处之一方面做得很好,但我认为它实际上并不能回答您的问题。实际上,简约不是黄金标准。现在不是,也从来没有。与简约有关的“黄金标准”是泛化错误。我们想开发不会过度拟合的模型。与样本中的样本一样,这对于样本外的预测(或可解释或具有最小误差)很有用。事实证明(由于上述原因),简约实际上是泛化错误的良好代理,但绝不是唯一的错误。

真的,请考虑为什么我们要使用交叉验证或引导或训练/测试集。目标是创建具有良好泛化精度的模型。很多时候,这些评估样本性能的方法的确会导致选择复杂度较低但并非总是如此的模型。举一个极端的例子,假设甲骨文为我们提供了一个真实但极其复杂的模型,一个糟糕却却简约的模型。如果简约是我们的目标,那么我们将选择第二个,但实际上,第一个是我们想学习的东西。不幸的是,很多时候最后一句话是“如果可以的话”。


哪个是“原始答案”?
mattdm 2015年

:) 很公平。马特的评论。
尼克·蒂姆

22

简约模型不仅是由于计算要求,而且对于泛化性能也是理想的。要实现完全准确地覆盖样本空间的无限数据的理想是不可能的,这意味着非简约模型可能会过度拟合和建模样本总体中的噪声或特质。

使用数百万个变量构建模型当然是可能的,但是您将使用对输出没有影响的变量对系统进行建模。您可以在训练数据集上获得出色的预测性能,但是那些无关紧要的变量很可能会在看不见的测试集中降低您的性能。

如果一个输出变量确实是一百万个输入变量的结果,那么最好将它们全部放入预测模型中,但前提是要有足够的数据。为了准确地建立这种规模的模型,您至少需要数百万个数据点。简约模型是很好的,因为在许多现实世界系统中,根本没有如此大小的数据集,此外,输出很大程度上由相对较少的变量决定。


5
+1。我建议阅读《统计学习的要素》(可在网络上免费获得),该书深入讨论了这个问题。
S. Kolassa-恢复莫妮卡2015年

3
另一方面,当您具有数百万个变量和很少的对象时,纯粹是偶然地,有些变量可能更能解释结果,即真正的相互作用。在这种情况下,基于简约的建模比蛮力方法更容易过拟合。

@CagdasOzgenc例如大型随机子空间合奏。

我觉得像套索方法可以在这里应用。
theforestecologist

17

我认为先前的答案在提出重要观点方面做得很好:

  • 简约模型倾向于具有更好的泛化特性。
  • 简约并不是真正的黄金标准,而只是一个考虑因素。

我想补充一些日常工作经验中提出的意见。

当然,预测准确性论证的概括性很强,但是在研究重点上存在学术偏见。通常,在生成统计模型时,经济性并不总是将预测绩效作为主要考虑因素。通常,对于给定的应用程序,有用模型的外观受到很大的外部约束:

  • 该模型必须在现有框架或系统中可实施
  • 该模型必须是非技术实体可以理解的。
  • 该模型必须在计算上高效
  • 该模型必须是可记录的
  • 该模型必须通过监管约束

在实际的应用领域中,许多(如果不是全部)考虑因素是预测性能之前(而不是之后)出现的,而模型形式和参数的优化受到这些需求的限制。这些约束中的每一个都会使科学家偏向简约。

的确,在许多领域中,这些限制正在逐步解除。但是,确实幸运的科学家确实忽略了它们,而只是将注意力集中在最小化泛化误差上。

对于刚离开学校的科学家来说,这可能非常令人沮丧(这绝对是对我来说,并且一直持续到我觉得对我的工作施加限制是没有道理的)。但是,最后,努力生产出不可接受的产品是一种浪费,这感觉比科学自豪感更糟。


2
没有节俭不是一个考虑。一个合理的推论程序如果能够很好地解释数据,则必须将一个简约模型放在一个非简约模型上。否则,模型的总压缩码长和由模型编码的数据将不是最小的。是的,这是一个黄金标准。
Cagdas Ozgenc 2015年

3
简约不是“黄金标准”!那句话是荒谬的。如果这是真的,那为什么我们不总是建立除了无条件均值之外什么都不适合的模型?我们参考测试集或更准确地说是全新的观察结果来权衡偏见和差异,并且在我们的领域,组织和法律的约束下进行此操作。有时,您只有足够的信息来做出幼稚的预测。有时您已经足够增加复杂性。
垃圾平衡

1
@BrashEquilibrium我认为Cagdas所说的是,鉴于在相同预测模型之间进行选择,因此应该选择最简约的模型。
马修·德鲁里

1
啊。那是另一回事。是的,在这种情况下,选择最简约的模型。我仍然不认为简约是“黄金标准”。
垃圾平衡

1
@MatthewDrury Brash,Cagdas。有趣。也许简约只是金本位制的一个组成部分。基于包含的概念,这可能(或应该)更好。耶鲁大学的以下天体物理学讲座很好地阐述了这一想法:oyc.yale.edu/astronomy/astr-160/lecture-11。7:04开始。David Hendry和Grayham Mizon的计量经济学/预测文学也都采用了这种想法。他们认为,包含是渐进研究策略的一部分,简约性是其中的一个方面。
Graeme Walsh

14

我认为这是一个很好的问题。在我看来,简约性被高估了。自然很少是简约的,因此我们也不必期望精确的预测或描述模型也是如此。关于可解释性问题,如果您选择一个仅因您能够理解而仅适度符合现实的简单模型,您究竟在理解什么?假设更复杂的模型具有更好的预测能力,无论如何它似乎更接近于实际情况。


8
说得好@dsaxton。对简约性有极大的误解,并且对于易失性特征选择的理解程度也很低。简约是由预先指定而产生的。数据挖掘导致的大多数简化都是令人误解的,只能因为错了才被理解。
Frank Harrell

2
@FrankHarrell您能否详细介绍“仅理解,因为这是错误的”,或者链接到您之前写过的一些东西?我想确保我理解这一点很有趣。
gui11aume15年

8
这是一个极端的例子,但是从事种族剖析的人认为他们通过单一特征(例如肤色)了解某人的价值。对他们而言,答案很简单。他们之所以只了解它,是因为他们通过过度简化来做出错误的判断。简约通常是一种幻想(牛顿力学和其他一些领域除外)。
弗兰克·哈雷尔

1
“自然很少是简约的”:而个体特别自然的一点就是个人(与我们典型的样本量相反!)。进化的每一代都使用了一批新的新个体...恕我直言,简约(Frank Harrell的预先指定类型-允许模型中m个可用特征中的任何n个实际上都是非常复杂的模型-即使n << m, (这是原始搜索空间的很小一部分),这就是我们试图至少从太小的数据集中获取某些信息的方法。
cbeleites支持Monica17年

2

简约不是一个黄金开始。这是建模的一个方面。建模(尤其是预测)无法编写脚本,即您不能仅将脚本交给建模人员遵循。您宁可定义建模过程必须依据的原则。因此,简约是这些原则之一,其应用无法编写脚本(再次!)。当选择模型时,建模者将考虑复杂性。

计算能力与此无关。如果您从事的行业是您的模型,那么您的模型将被商人,产品人员或您所称呼的任何人所使用。您必须向他们解释您的模型,这应该对他们有意义。在这方面,拥有简化模型会有所帮助。

例如,您正在预测产品销售。您应该能够描述什么是销售驱动力,以及它们如何运作。这些必须与业务运作的概念相关,并且相关关系必须被业务理解并接受。对于复杂的模型,很难解释模型的结果或将差异归因于实际情况。如果您无法向业务解释您的模型,那么您将不会被它所珍视。

还有一点对预测特别重要。假设您的模型依赖于N个外生变量。这意味着您必须首先获取这些变量的预测才能预测因变量。N越小,您的生活就越轻松,因此更简单的模型也更易于使用。


尽管您提到了预测,但是大多数答案似乎仅适用于解释性建模。
rolando2 '16

@ rolando2,听起来像是因为在我的域中,您不能简单地将预测传递给用户。我们必须对天气预报进行解释,并将其链接到驾驶员等。获得天气预报时,通常不会要求天气预报员向您解释为什么他们确切地认为下雨的机会为50%。就我而言,我不仅必须这样做,而且还应通过使消费者将其链接到他们每天处理的业务驱动因素来理解结果的方式进行。这就是为什么简约性本身就是有价值的原因
Aksakal,2016年

1

也许可以回顾一下Akaike信息准则,这个概念我昨天才偶然发现。AIC试图确定哪种模型和多少个参数是当前观察的最佳解释,而不是任何基本的Occam的Razor或简约方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.