Answers:
我认为最好通过两部分来分析它的含义:
“所有模型都是错误的”,也就是说,每个模型都是错误的,因为它是对现实的简化。一些模型,特别是在“硬”科学中,只是有点错误。他们无视摩擦或微小物体的引力作用。其他模型有很多错误-他们忽略了更大的事情。在社会科学中,我们忽略了很多。
“但是有些有用”-简化现实可能非常有用。它们可以帮助我们解释,预测和理解宇宙及其所有组成部分。
这不仅在统计上是正确的!地图是一种模型。他们错了。但是好的地图非常有用。其他有用但错误的模型的例子比比皆是。
这意味着可以从模型中获得有用的见解,而这些模型并不能完美地表示它们所建模的现象。
统计模型是对使用数学概念的系统的描述。因此,在许多情况下,您需要添加特定的抽象层以简化推理过程(例如,测量误差的正态性,相关结构中的复合对称性等)。这是几乎不可能针对单个模型来描述一个完美真实世界的现象给自己有一个世界的主观看法(我们的感觉系统还不完善); 但是,由于我们的世界确实具有一定程度的一致性,因此确实可以进行成功的统计推断。因此,我们几乎总是错误的模型确实有用。
(我敢肯定,您很快就会得到一个大胆的答复,但我试图对此做个简洁!)
An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem.
我实际上对JT的引用非常有见地。)
我发现Thad Tarpey在2009年的JSA演讲中对Box段落提供了有用的解释和评论。他认为,如果我们将模型视为对真相的近似,那么我们可以很容易地将所有模型称为正确。
这是摘要:
经常向统计学专业的学生介绍乔治·博克斯(George Box)的著名语录:“所有模型都是错误的,有些模型是有用的。”在本次演讲中,我认为该引用尽管有用,但却是错误的。另一种更积极的观点是承认模型只是从数据中提取感兴趣信息的一种手段。事实是无限复杂的,模型只是事实的近似。如果近似值不佳或具有误导性,则该模型将无用。在本次演讲中,我将举例说明不是真实模型的正确模型。我说明了“错误”模型的概念如何导致错误的结论。
如果结果中存在任何随机性,则模型无法提供100%准确的预测。如果没有不确定性,没有随机性和没有错误,那么它将被视为事实而不是模型。第一个非常重要,因为模型经常用于对未发生事件的期望进行建模。这几乎保证了真实事件的不确定性。
给定完美的信息,理论上可能会创建一个模型,为此类精确已知的事件提供完美的预测。但是,即使在这些不太可能的情况下,这样的模型也可能如此复杂以至于在计算上无法使用,并且可能仅在特定的时间点是准确的,因为其他因素会改变值随事件的变化方式。
由于大多数现实世界数据中都存在不确定性和随机性,因此获得完美模型的努力是徒劳的。取而代之的是,着眼于获得足够准确的模型,该模型应足够简单以就其使用所需的数据和计算而言都可以使用。尽管已知这些模型不完善,但其中一些缺陷是众所周知的,可以考虑基于这些模型进行决策。
较简单的模型可能并不完美,但它们也更易于推论,相互比较,并且可能更易于使用,因为它们对计算的要求可能较低。
您可能会这样想。对象的最大复杂度(即熵)服从某种形式的Bekenstein界:
在大多数情况下,这是一个很大的数字:
那么,您是否要对每个单元中所有粒子的所有波动方程使用“最佳图”(即地域本身)?绝对不。这不仅会造成计算上的灾难,而且还会建模与您关心的事物本质上无关的事物。如果您只想确定我是否醒着,则无需知道#32458神经元#844030核糖体#2305分子#2中的电子。如果您没有对此建模,那么您的模型确实是“错误的”,但是如果您可以确定我是否醒着,那么您的模型绝对有用。
作为天文统计学家(也许是稀有品种),我发现Box格言的名声很不幸。在物理科学中,我们通常对理解观察到的现象的过程有着强烈的共识,并且这些过程通常可以由引力定律,量子力学,热力学等产生的数学模型来表示。统计目标是为了估计最适合的模型参数的物理属性,以及模型的选择和验证。2013年3月,欧洲航天局的普朗克卫星发表了一些论文,最近发生了一起戏剧性事件。对宇宙微波背景的测量令人信服地为“大爆炸”建立了一个简单的6参数“ LambdaCDM”模型。我怀疑Box的教义是否会适用于这29篇论文中使用的广泛的高级统计方法中的任何地方。
“所有模型都是错误的,但有些是有用的”。也许这意味着:我们应该用我们所知道的+寻求新的知识来尽力而为?
Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful.
也许这样会更有帮助。