“所有模型都是错误的,但有些模型是有用的”的含义是什么


76

“本质上,所有模型都是错误的,但有些模型是有用的。”

--- Box,乔治·EP;Norman R.Draper(1987)。经验模型的建立和响应面,p。424,威利。ISBN 0471810339。

以上短语的确切含义是什么?


13
在同一本书上曾提到过:Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful.也许这样会更有帮助。
usεr11852

Answers:


101

我认为最好通过两部分来分析它的含义:

“所有模型都是错误的”,也就是说,每个模型都是错误的,因为它是对现实的简化。一些模型,特别是在“硬”科学中,只是有点错误。他们无视摩擦或微小物体的引力作用。其他模型有很多错误-他们忽略了更大的事情。在社会科学中,我们忽略了很多。

“但是有些有用”-简化现实可能非常有用。它们可以帮助我们解释,预测和理解宇宙及其所有组成部分。

这不仅在统计上是正确的!地图是一种模型。他们错了。但是好的地图非常有用。其他有用但错误的模型的例子比比皆是。


20
+1因为我喜欢这些地图的类比。我以后会用!
usεr11852

4
“强硬”科学中的许多模型也相距甚远(昨天我参加了一个研讨会,在该研讨会上,模型位于误差条之内,但误差条为两个数量级)。
gerrit

7
+1。我认为您的关键词是“每个模型都是错误的,因为它是对现实的简化”。人们通常会忘记这一点,例如在对经济学的幼稚批评中(我有我自己的批评,但它们不仅要比“现实比您的模型更复杂”,而且还要更加复杂)。如果我们不简化它,那么您将拥有原始现实,这对我们来说太复杂了。因此,我们必须简化它以获得任何见解。
彼得·埃利斯

13
比例为1:1的完美地图的幻想已被许多作者使用,包括Lewis Carroll,Jorge Luis Borges和Umberto Eco。实际上,这没有用,因为它所映射的区域必然很复杂,而且不容易理解(更不用说将其展开并布置为阅读的尴尬了)。
尼克·考克斯

2
也许您还可以补充一点,就是模型必须有点错误,因为否则它将无法泛化,因此无法在其他地方应用。有一些答案说明了这一点。但是现在有太多的答案无法全部阅读。
ziggystar 2014年

9

这意味着可以从模型中获得有用的见解,而这些模型并不能完美地表示它们所建模的现象。

统计模型是对使用数学概念的系统的描述。因此,在许多情况下,您需要添加特定的抽象层以简化推理过程(例如,测量误差的正态性,相关结构中的复合对称性等)。这是几乎不可能针对单个模型来描述一个完美真实世界的现象给自己有一个世界的主观看法(我们的感觉系统还不完善); 但是,由于我们的世界确实具有一定程度的一致性,因此确实可以进行成功的统计推断。因此,我们几乎总是错误的模型确实有用

(我敢肯定,您很快就会得到一个大胆的答复,但我试图对此做个简洁!)


我们能否说这些有用的模型提供了近似的解决方案?
gpuguy

2
@gpuguy:当然可以。引用John Tukey的话:(An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem.我实际上对JT的引用非常有见地。)
usεr11852'13

6
“对于正确的问题(通常是模糊的),比对错误的问题的精确答案要好,后者总是可以被精确化。” John W. Tukey 1962数据分析的未来。《数学统计年鉴》 33:1-67(请参阅第13-14页)毫无疑问,他在其他时候也说过类似的话,但这是通常的消息来源。
Nick Cox 2013年

我直接从相关CV的引号线程c-p'ed引号。
usεr11852

6
我从原始出版物中复制了我的。
Nick Cox

6

我发现Thad Tarpey在2009年的JSA演讲中对Box段落提供了有用的解释和评论。他认为,如果我们将模型视为对真相的近似,那么我们可以很容易地将所有模型称为正确。

这是摘要:

经常向统计学专业的学生介绍乔治·博克斯(George Box)的著名语录:“所有模型都是错误的,有些模型是有用的。”在本次演讲中,我认为该引用尽管有用,但却是错误的。另一种更积极的观点是承认模型只是从数据中提取感兴趣信息的一种手段。事实是无限复杂的,模型只是事实的近似。如果近似值不佳或具有误导性,则该模型将无用。在本次演讲中,我将举例说明不是真实模型的正确模型。我说明了“错误”模型的概念如何导致错误的结论。


3

对我来说,真正的见解在于以下方面:

模型不一定非要正确才有用。

不幸的是,在许多科学中,人们常常忘记了模型不一定必须是现实的精确表示即可允许新的发现和预测!

因此,不要浪费您的时间来构建需要对无数变量进行准确测量的复杂模型。真正的天才发明了可以完成这项工作的简单模型。


3

如果结果中存在任何随机性,则模型无法提供100%准确的预测。如果没有不确定性,没有随机性和没有错误,那么它将被视为事实而不是模型。第一个非常重要,因为模型经常用于对未发生事件的期望进行建模。这几乎保证了真实事件的不确定性。

给定完美的信息,理论上可能会创建一个模型,为此类精确已知的事件提供完美的预测。但是,即使在这些不太可能的情况下,这样的模型也可能如此复杂以至于在计算上无法使用,并且可能仅在特定的时间点是准确的,因为其他因素会改变值随事件的变化方式。

由于大多数现实世界数据中都存在不确定性和随机性,因此获得完美模型的努力是徒劳的。取而代之的是,着眼于获得足够准确的模型,该模型应足够简单以就其使用所需的数据和计算而言都可以使用。尽管已知这些模型不完善,但其中一些缺陷是众所周知的,可以考虑基于这些模型进行决策。

较简单的模型可能并不完美,但它们也更易于推论,相互比较,并且可能更易于使用,因为它们对计算的要求可能较低。


3

如果可以的话,可能仅是多条评论。我更喜欢的版本是

(...)所有模型均为近似值。本质上,所有模型都是错误的,但是有些模型很有用(...)

取自Box and Draper的“ 响应面,混合物和Ridge分析”(Wiley,2007年,第414页)。查看扩展引文,可以更清楚地看到Box的意思-统计建模是关于逼近现实,而逼近从来都不是精确的,因此它是关于找到最合适的逼近。适合您目的的是一个主观的东西,这就是为什么它不是有用的模型之一,但根据建模的目的,其中一些模型可能有用。


3

由于没有人添加它,因此George Box使用引用的阶段在书中介绍以下部分。我相信他在解释他的意思方面做得最好:

PV=RTPVTR

对于这样的模型,不需要问“模型是否正确?”的问题。如果将“真相”作为“整体真理”,则答案必须是“否”。唯一感兴趣的问题是“模型是否具有启发性并有用?”。

Box,GEP(1979),“科学模型构建策略中的稳健性”,位于美国劳伦斯州劳纳;威尔金森(Wilkinson),GN,《统计的稳健性》,学术出版社,第201–236页。


2

您可能会这样想。对象的最大复杂度(即熵)服从某种形式的Bekenstein界

I2πREcln2

ER

在大多数情况下,这是一个很大的数字:

2.58991·1042 107.79640 · 10 41Ω=2I107.79640·1041

那么,您是否要对每个单元中所有粒子的所有波动方程使用“最佳图”(即地域本身)?绝对不。这不仅会造成计算上的灾难,而且还会建模与您关心的事物本质上无关的事物。如果您只想确定我是否醒着,则无需知道#32458神经元#844030核糖体#2305分子#2中的电子。如果您没有对此建模,那么您的模型确实是“错误的”,但是如果您可以确定我是否醒着,那么您的模型绝对有用。


2

我认为Peter和user11852提供了很好的答案。我还要(否定)补充说,如果模型真的很好,那么由于过度拟合(因此不可通用)而可能是无用的。


2
+1为过拟合点。即使您知道基础模型不正确(例如,垃圾邮件过滤),诸如朴素贝叶斯(Naive Bayes)和线性判别分析之类的算法通常也能很好地工作,这仅仅是因为估计参数所需的数据较少。
2013年

1

我的酸性解释是:相信数学模型可以准确描述所有因素及其相互作用,从而控制一种感兴趣的现象将过于简单和傲慢。我们甚至不知道我们使用的逻辑是否足以理解我们的宇宙。但是,一些数学模型代表了足够好的近似值(就科学方法而言),可用于得出有关这种现象的结论。


1

作为天文统计学家(也许是稀有品种),我发现Box格言的名声很不幸。在物理科学中,我们通常对理解观察到的现象的过程有着强烈的共识,并且这些过程通常可以由引力定律,量子力学,热力学等产生的数学模型来表示。统计目标是为了估计最适合的模型参数的物理属性,以及模型的选择和验证。2013年3月,欧洲航天局的普朗克卫星发表了一些论文,最近发生了一起戏剧性事件。对宇宙微波背景的测量令人信服地为“大爆炸”建立了一个简单的6参数“ LambdaCDM”模型。我怀疑Box的教义是否会适用于这29篇论文中使用的广泛的高级统计方法中的任何地方。


1

我只是通过将过程模型作为重点来表述上述答案。该语句可以解释如下:

“所有模型都是错误的”,也就是说,每个模型都是错误的,因为它是对现实的简化。有些型号只是有点错误。他们忽略了一些事情,例如:->更改需求,->在截止日期之前忽略项目的完成,->没有考虑客户期望的质量水平等...其他模型有很多错误-他们忽略了更大的东西。与敏捷的过程模型相比,传统的软件过程模型忽略了很多。

“但是有些有用”-简化现实可能非常有用。他们可以帮助我们解释,预测和理解整个项目及其所有组成部分。之所以使用模型,是因为它们的功能与大多数软件开发程序相对应。


0

我想对术语“有用”进行另一种解释。可能不是一个Box想到的。

当您必须做出决定时,这就是所有信息最终将被用于的目的,那么您就必须以某种形式来衡量您的成功。当谈论具有不确定信息的决策时,该度量通常称为效用。

因此,我们还可以将有用的模型视为能够使我们做出更明智的决策的模型。以更有效地实现我们的目标。

这在通常的标准之上又增加了另一个维度,例如模型正确预测某些东西的能力:它使我们能够权衡模型所涉及的各个方面。


-2

“所有模型都是错误的,但有些是有用的”。也许这意味着:我们应该用我们所知道的+寻求新的知识来尽力而为?


4
(-1)您能否提供任何暗示GEP Box含义的参考?从其他答案中可以发现,他的意思完全不同。

OP可能正在接受报价并给予新的解释。我同意Tim的观点,Box或多或少都说不要将模型作为对现实的精确解释,但要意识到某些模型可以很好地描述数据。
Michael Chernick
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.