所有模型都没有用吗?有没有确切的模型可能有用?


45

这个问题在我心中困扰了一个多月。2015年2月的《Amstat新闻》收录了伯克利教授Mark van der Laan 的一篇文章,该文章谴责人们使用不精确的模型。他指出,通过使用模型,统计才是一门艺术而不是一门科学。根据他的说法,人们总是可以使用“精确模型”,而我们这样做的失败会导致“缺乏严格……我担心我们在数据科学中的代表地位将被边缘化”。

我同意我们有被边缘化的危险,但是威胁通常来自那些声称(听起来很像范德兰教授的人)他们没有使用某种近似方法,但实际上他们的方法却少得多的人严格的数据模型比经过仔细应用的统计模型还要严格-甚至是错误的统计模型。

我认为可以说范德兰教授对那些重复Box经常使用的话的人很鄙视:“所有模型都是错误的,但有些模型是有用的。” 基本上,正如我读到的那样,他说所有模型都是错误的,并且都是无用的。现在,我该拒绝伯克利大学教授的观点吗?另一方面,他是谁如此轻描淡写地拒绝了我们领域中真正的巨头之一的观点?

van der Laan博士在详细阐述时指出:“声明所有模型都是错误的,完全是胡说八道……例如,没有任何假设的统计模型始终是正确的。” 他继续说:“但是通常,我们可以做得更好:我们可能知道数据是独立的相同实验的结果。” 除了非常狭窄的随机采样或受控实验设置外,我看不出有人会知道这一点。作者指出他在有针对性的最大似然学习和有针对性的基于最小损失的学习中的工作,这些工作“将最先进的技术集成到了机器学习/数据自适应估计中,所有因果推理,审查数据,效率和经验方面的令人难以置信的进步过程理论,同时仍然提供正式的统计推断。”ñ

我也同意一些说法。他说,我们需要认真对待我们的工作,我们作为统计学家的角色以及我们的科学合作者。听见!当人们例行使用逻辑回归模型或其他任何方法而没有仔细考虑是否足以回答科学问题或是否适合数据时,这无疑是个坏消息。我确实在该论坛上发布的问题中看到了很多此类滥用行为。但是我也看到不精确模型(甚至参数模型)的有效和有价值的使用。与他所说的相反,我很少被“另一种逻辑回归模型闷死”。我猜这就是我的天真。

所以这是我的问题:

  1. 使用完全不做任何假设的模型,可以做出哪些有用的统计推断?
  2. 是否存在使用目标最大可能性使用重要的真实数据的案例研究?这些方法是否被广泛使用和接受?
  3. 所有不精确的模型真的没有用吗?
  4. 除了琐碎的情况以外,是否可能知道您拥有确切的模型
  5. 如果这太基于观点,因此太离题了,该在哪里讨论?因为范德兰博士的文章确实需要进行一些讨论。

13
我会说没有假设的模型几乎总是无用的,但是van der Laan肯定会在没有承认的情况下做出假设。我们实际上并不确定很多事情,因此他的“我们可能知道数据是n个独立的相同实验的结果”实际上是一种假设,或者至少是部分假设。我们可能有充分的理由假设它们是相同且独立的,但在实践中,我们经常发现事实并非如此(并且,如果我们发现有时,有时必须不为人所动,大概是更多时候) )。
Glen_b 2015年

19
没有假设的模型只是您的数据矩阵的复制。的确如此,但也无济于事。可能还会有人争辩说,这样的模型不是模型:模型的一个定义是它是对现实的简化。因此,根据定义,不能简化的模型不是模型。简化的目的是:它可以帮助我们实质性地了解正在发生的事情;它给了我们一个主要的故事。如果您不关心了解事情发生的原因而只想预测的话,那么这个主要故事就毫无意义。但是,有些人想要做的不只是制作水晶球……
Maarten Buis

8
没有假设的模型不是模型。该模型是假设的集合。另外,正如@Glen_b所说,iid假设很强,我想不出一个例子是“ true”。即使反复掷硬币,也存在相关性(请参见Diaconis的工作)。我只浏览了这篇文章,但似乎是短视的。
P.Windridge

11
作者关于飞往火星的第一个例子是伪造的。牛顿力学(太空任务的许多方面都依赖它)是一个错误的模型,但是我们依靠它并且它很有用。
P.Windridge

6
是的,牛顿力学是乔治·博克斯观点的一个很好的例子。
Glen_b

Answers:


15

引用的文章似乎基于这样的担心,即统计学家“不会成为科学团队的内在组成部分,科学家自然会对使用的方法产生怀疑”,并且“合作者会将我们视为能够指导他们的技术人员”他们的科学成果发表了。” 我对@rvl提出的问题的评论来自一位非统计学家的生物学家的观点,这位生物学家在过去几年中从基准研究转移到转化/临床研究时被迫应对日益复杂的统计问题。现在,该页面上的多个答案已经清楚地回答了问题5;我将从那里以相反的顺序去。

4)“精确模型”是否存在并不重要,因为即使存在,我也无力承担这项研究。在讨论的背景下考虑这个问题:我们是否真的需要包括“所有相关的预测变量”?即使我们可以识别“所有相关的预测变量”,仍然存在收集足够数据以提供纳入的自由度的问题。他们都可靠地进入了模型。在对照实验研究中很难做到这一点,更不用说回顾性研究或人群研究了。也许在某些类型的“大数据”中问题不大,但这是对我和我的同事而言。@Aksakal总是在该页面上给出答案,因此始终需要“对此保持精明” 。

为了公平起见,范德兰教授不使用引文中的“精确”一词,至少在当前可从链接在线获得的版本中不使用“精确”一词。他谈到“现实”模型。这是一个重要的区别。

再说一次,范德兰教授抱怨说“统计现在是一门艺术,而不是一门科学”,这对他而言有点不公平。考虑一下他建议与合作者合作的方式:

...我们需要认真对待数据,我们作为统计学家的身份以及我们的科学合作者。我们需要尽可能多地了解如何生成数据。提出了现实的统计模型后,我们需要从合作者中提取最能代表他们感兴趣的科学问题的答案的估计。这是很多工作。很难。它需要对统计理论有一个合理的了解。这是一个值得的学术企业!

像在任何科学企业中所做的工作一样,将这些科学原理应用于现实世界中的问题似乎需要大量的“艺术”。我已经认识了一些非常成功的科学家,还有更多做得还不错的科学家,还有一些失败。以我的经验,差异似乎是追求科学目标的“艺术”。结果可能是科学,但是过程却更多。

3)同样,问题的一部分是术语;van der Laan教授寻求的“精确”模型与“现实”模型之间存在很大差异。他声称,许多标准的统计模型都不现实,无法产生“不可靠”的结果。特别是:“不能基于参数模型来明智地估计诚实统计模型中定义的估计量”。这些是测试的问题,不是意见。

他自己的工作清楚地认识到并非总是可以使用精确的模型。在缺少结果变量的情况下,考虑针对目标最大似然估计量(TMLE)撰写的手稿。它基于对结果随机丢失的假设,在实践中可能永远无法检验:“ ...我们假设,缺失与结果之间的关系不存在无法观察的混杂因素。” 这是难以包含“所有相关预测变量”的另一个示例。但是,TMLE的优势在于,它确实有助于评估数据中适当支持的“阳性假设”,以便在这种情况下估计目标参数。目标是尽可能接近实际数据模型。

2)先前已经在交叉验证中讨论了 TMLE 。我不了解实际数据的广泛使用。Google学术搜索今天显示了258次引用,似乎是最初的报告,但乍看之下似乎没有出现在大型现实数据集上。在对有关的R-包杂志统计的软件本文只显示27个今天谷歌学术引用。但是,这不应被视为有关TMLE价值的证据。它的重点是获取实际感兴趣的“估计”的可靠的无偏估计,这通常是从标准统计模型得出的插件估计的问题,它似乎具有潜在的价值。

1)陈述:“没有任何假设的统计模型始终是正确的”似乎旨在作为一个稻草人,重言式。数据就是数据。我假设宇宙的某些规律每天都保持一致。TMLE方法大概包含有关搜索空间凸度的假设,并且如上所述,在特定上下文中应用TMLE方法可能需要其他假设。

即使范德兰教授也同意某些假设是必要的。我的感觉是,他想减少假设的数量,并避免那些不切实际的假设。正如他似乎声称的那样,这是否真的需要放弃参数模型是至关重要的问题。


很好的答案。《目标学习》一书是学习更多内容的好地方。除理论外,它还包含一些案例研究。
NRH

12

也许我错过了要点,但我认为您必须退后一步。

我认为他的观点是滥用了易于获得的工具,而没有更多的知识。对于简单的t检验也是如此:只需将算法与数据一起输入,得到p <0.05并认为您的论文是正确的。完全错误。当然,您必须更多地了解您的数据。

向后退一步:没有什么比一个精确的模型(这里的物理学家)更重要的了。但是有些人非常同意我们的测量。唯一确切的事情是数学。其中有无关现实或它的模型。其他所有事物(以及现实的每个模型)都是“错误的”(经常被引用)。

但是什么是“错误的”和有用的呢?自己判断:

我们目前所有的高科技(计算机,火箭,放射性等)都基于这些错误的模型。甚至可以通过“错误”模型的“错误”模拟来计算。
->更多地关注“有用”而不是“错误”;)

更明确地回答您的问题:

  1. 不知道,对不起!
  2. 是。一个例子:在粒子物理学中,您想要检测某些粒子(例如电子,质子等)。每个粒子都会在检测器中留下特征迹线(因此也会留下数据),但即使是相同的粒子也会因其性质而变化。如今,大多数人都使用机器学习来实现这一目标(这是一个巨大的简化,但是非常像这样),与手工统计相比,效率提高了20%-50%。
  3. 没人真正声称这!不要做出错误的结论!(a:所有模型都不精确,b:一些模型有用。不要混淆事物)
  4. 没有什么是精确的模型(除了数学以外,但统计学上并没有真正的意义,因为它的点正好位于一条直线上,并且“拟合”一条直线可能是正确的……但这是一个有趣的特殊情况,永远不会发生) 。
  5. 不知道:)但是恕我直言,我更认为这是“因为每个孩子都可以使用它,而不是每个人都可以使用”,并且不要盲目使用它。

我会考虑您的观点,但是在(3)和(4)上,我建议您查看van der Laan的文章以及我的问题,因为该文章确实清楚地表明了他对不精确的模型没有用,并且反复提到“精确模型”。所以是的,我要说确实有人这么说。我非常同意您所说的关于模型以及方法的机械应用的观点;因此,我认为您不想让自己退后一步是我。
rvl

全部同意。最主要的是,我肯定是要他退后一步;)我认为,我没有提到的要建立理论(数学)模型,您当然需要“精确”模型。因此,要“发明”更好的模型和统计工具,您需要确定性(或精确)模型作为基础。我认为,即使是针对面团的学习也不必一定是这种“不精确”。
Mayou16年

6

在econ中,关于理解“数据生成过程”的内容很多。我不确定“精确”模型的确切含义,但在econ中它可能与“正确指定”模型相同。

当然,您想在尝试模型之前尽可能多地了解生成数据的过程,对吗?我认为困难来自于:a)我们可能对真实的DGP毫无头绪,而b)即使我们知道真实的DGP,建模和估计也很难(出于许多原因)。

因此,您进行假设以简化事务并降低估计要求。您能知道您的假设是否正确吗?您可以获得支持它们的证据,但是IMO在某些情况下很难真正确定。

我必须根据既定的理论和实用性对所有这些进行过滤。如果您做出的假设与理论相符,并且该假设为您提供了更好的估计性能(效率,准确性,一致性等),那么即使它使模型“不精确”,我也没有理由避免使用它。

坦率地说,我认为本文旨在激发那些使用数据的人更加认真地思考整个建模过程。范德兰显然在他的工作中做出了假设。实际上,在此示例中,van der Laan似乎抛弃了对精确模型的任何关注,而是使用了一系列混搭过程来最大化性能。这使我更加自信,他提出Box的报价是为了防止人们将其用作摆脱理解问题的艰巨工作的逃避。

让我们面对现实吧,世界到处是对统计模型的滥用和滥用。人们盲目地运用他们知道怎么做的方法,更糟糕的是,其他人常常以最理想的方式解释结果。这篇文章提醒您要小心,但我认为我们不应将其推到极致。

以上对您的问题的含义:

  1. 我同意这篇文章中的其他人,他们将模型定义为一组假设。根据该定义,没有假设的模型实际上不是模型。 甚至探索性数据分析(即无模型)也需要假设。 例如,大多数人认为数据已正确测量。
  2. 我本质上不了解TMLE,但是在经济学中,有许多文章使用相同的基本原理来推断对未观察到的反事实样本的因果效应。但是,在这些情况下,接受治疗并不独立于模型中的其他变量(与TMLE不同),因此经济学家广泛使用了模型。有一些针对结构模型的案例研究,例如在案例中,作者说服了公司实施其模型并获得了良好的结果。
  3. 我认为所有模型都是不精确的,但是同样,这个术语有点模糊。IMO,这是Box报价的核心。我将以这种方式重申我对Box的理解:“没有模型可以捕捉到现实的确切本质,但是某些模型的确捕捉到了感兴趣的变量,因此从这个意义上讲,您可能会用到它们。”
  4. 我在上面解决了这个问题。简而言之,我不这么认为。
  5. 我不确定。我喜欢这里。

5

要解决第3点,答案显然是“否”。几乎每个人类企业在某个时候都基于简化的模型:烹饪,建筑,人际关系都涉及人类根据某种数据+假设来行动。从来没有人构建过他们不打算使用的模型。断言否则就是闲杂的学问。

询问不精确的模型什么时候有用,为什么它们的有用性会失败,以及当我们依赖那些证明最终没有用的模型时会发生什么,这将变得更加有趣和启发。无论是学术界还是工业界的任何研究人员,都必须经常性地提出这个问题。

我认为这个问题一般无法回答,但是错误传播的原理将为您解答。当不精确的模型无法预测实际行为时,它们就会崩溃。了解错误如何在系统中传播可以帮助您了解在对系统进行建模时需要多少精度。

例如,刚性球通常不是棒球的坏模型。但是,当您设计捕手的手套时,此模型会使您失败,并导致您设计错误的东西。关于棒球物理学的简化假设会通过棒球手套系统传播,并导致您得出错误的结论。


5

1)使用完全不做任何假设的模型,可以做出哪些有用的统计推断?

根据定义,模型是对您所观察的内容的概括,可以由某些因果因素捕获,这些因果因素又可以解释和估计您所观察的事件。假设所有这些归纳算法都具有某种基本假设。如果您没有任何假设,我不确定模型还剩下什么。我认为您剩下的是原始数据,没有模型。

2)是否存在案例研究,使用重要的真实数据进行有针对性的最大可能性?这些方法是否被广泛使用和接受?

我不知道。始终使用最大可能性。Logit模型也基于这些模型以及许多其他模型。它们与标准OLS的差别不大,在标准OLS中,您专注于残差平方和的减少。我不确定目标最大可能性是多少。并且,它与传统的最大可能性有何不同。

3)所有不精确的模型是否真的没有用?

绝对不。不精确的模型可能非常有用。首先,它们有助于更好地理解或解释现象。那应该算什么。其次,他们可以提供具有相关置信区间的下降估计和预测,以捕获估计周围的不确定性。这样可以提供有关您正在学习的内容的大量信息。

“不精确”的问题也提出了简约与过度适应之间的紧张问题。您可以有一个简单的模型,其中包含5个变量,这些变量是“ inexact”,但在捕获和解释因变量的总体趋势方面做得很好。您可以拥有一个具有10个变量的更复杂的模型,该模型比第一个变量“更精确”(较高的调整R平方,较低的标准误差等)。但是,当您使用Hold Out样本对其进行测试时,第二个更复杂的模型实际上可能会崩溃。并且,在这种情况下,“ Hinexact”模型实际上在Hold Out示例中的性能要好得多。这实际上在计量经济学中一直存在,我怀疑在许多其他社会科学中。提防“精确”模型。

4)是否有可能知道除平凡情况外,您是否拥有确切的模型?

无法知道您拥有确切的模型。但是,有可能知道您有一个很好的模型。信息标准度量(AIC,BIC,SIC)可以为您提供大量信息,从而可以比较和基准化各种模型的相对性能。同样,LINK测试也可以在这方面提供帮助。

5)如果这太基于观点,因此太离题了,该在哪里讨论?因为范德兰博士的文章确实需要进行一些讨论。

我认为这是一个讨论此问题的合适论坛。对于我们大多数人来说,这是一个非常有趣的问题。


5

(我没有在文章中看到短语“精确模型”(尽管上面引用了))

1)使用完全不做任何假设的模型,可以做出哪些有用的统计推断?

你必须从某个地方开始。 如果仅此而已(什么都没有),则可以作为起点。

2)是否存在案例研究,使用重要的真实数据进行有针对性的最大可能性?这些方法是否被广泛使用和接受?

为了回答第二个问题,arxiv.org中的论文93/1143281(〜.008%)中出现了“目标最大可能性”。因此,没有一个很好的估计(无假设)。

3)所有不精确的模型是否真的没有用?

不会有时您只关心模型的一个方面。这方面可能很好,而其他方面则很不精确。

4)是否有可能知道除平凡情况外,您是否拥有确切的模型?

最好的模式是,该模型最好的回答你的问题。那可能意味着遗漏了一些东西。您要尽量避免的是违反假设的情况。

5)欢乐时光。而且饮料更便宜!

我发现使用“精确”一词有点令人不安。这不是非常像统计学家的话题。不适应?变异?感谢GD!这就是为什么我们都在这里。我认为“所有型号都错了……”这句话是可以的,但只有在正确的公司中才能做到。统计人员了解这意味着什么,但很少有人知道。


关于短语“精确模型”的要点。他说关于“真实”和“实际”模型的事情是等效的,尤其是考虑到本文的上下文和语气,但是您说得对,引用不是“精确”(双关语意)。
SQLServerSteve

我的错。我应该正确地引用他的话。
RVL

我觉得尝试建立真实或实际模型会错过练习的重点。我认为他真正想讨论的是不好的模型。
mandata

是的,这篇文章提出了很多好处,但是当它们实际上在某种程度上都是错误的时,他会散布许多极端的评论,例如“声明所有模型都是错误的完全是胡说八道”。否则,这是胡说八道。他绝对在极端位置上。Rvl提出并宣布他是完全正确的(不要大喊Ryl,重要的是您正确地理解了含义)。
SQLServerSteve

4

在我看来,该文章似乎是诚实但政治的文章,是真诚的辩论。因此,它包含了许多充满激情的段落,这些段落都是科学的胡说八道,但是仍然可以有效地激发重要问题上的有益对话和讨论。

这里有很多很好的答案,所以让我引用本文中的几行内容,以表明兰恩教授的工作中肯定没有使用任何“精确模型”(顺便说一句,他说“精确模型”模型”是等同于实际数据生成机制的概念吗?)

行情(加粗我的强调)

“一旦提出了切合实际的统计模型,我们就需要从合作者中提取最能代表他们感兴趣的科学问题的答案的估计。

评论: “现实”与“精确”一样,与火星来自地球一样。虽然它们都绕太阳公转,所以出于某些目的,选择哪个行星都没有关系。对于其他目的,这确实很重要。“最好”也是一个相对的概念。“精确”不是。

诚实的统计模型中定义的估计值的估计者无法根据参数模型进行合理的估计...

评论:诚实确实是最好的政策,但是肯定不能保证它是“精确的”。同样,如果使用“精确模型”,“明智的估计”似乎是一种非常稀释的结果。

为了尽我们最大可能解决这些困难的估计问题,我们开发了一种通用的统计方法...

评论:好的。我们正在“尽力而为”。几乎每个人都在考虑自己。但是“我们能做到的最好”不是“确切的”。


2

鉴于乔治·F·克利尔(George F. Klir)关于模糊集的书中讨论的不确定性管理的真正有用原理,我将从哲学的另一个方向进行探讨。我不能提供范德兰的精确性,但我可以提供一个详尽的案例,说明为什么他的目标在逻辑上是不可能的。这将引起冗长的讨论,涉及其他领域,请耐心等待。

Klir和他的合著者将不确定性分为几种亚型,例如非特异性(即,当您有一组未知的替代方案时,可以通过Hartley函数之类的方法进行处理)。定义不精确(即在模糊集中建模和量化的“模糊性”);证据上的冲突或不和谐(在Dempster-Shafer证据理论中得到了解决);加上概率论,可能性论和度量不确定性,目的是要有足够的范围来捕获相关证据,同时最大程度地减少错误。我将整个统计技术工具箱视为以不同方式划分不确定性的另一种方法,就像千篇一律。置信区间和p值以一种方式隔离不确定性,而诸如Shannon的熵之类的度量则从另一个角度将其降低。他们能做什么 但是,要做的就是彻底消除它。为了获得范德兰似乎描述的那种“精确模型”,我们需要将所有这些类型的不确定性降低到零,以便不再需要划分。一个真正的“精确”模型将始终具有1的概率和可能性值,非特异性得分为0,并且在术语定义,值范围或度量范围中都没有不确定性。在其他证据来源中不会有矛盾。这种模型所做的预测将始终是100%准确的;预测模型从本质上将其不确定性分配到了未来,但是没有什么可以推迟的。不确定性观点具有一些重要含义:范德兰(Van der Laan)似乎描述了这种类型,我们需要将所有这些类型的不确定性降低到零,以便不再需要划分。一个真正的“精确”模型将始终具有1的概率和可能性值,非特异性得分为0,并且在术语定义,值范围或度量范围中都没有不确定性。在其他证据来源中不会有矛盾。这种模型所做的预测将始终是100%准确的;预测模型从本质上将其不确定性分配到了未来,但是没有什么可以推迟的。不确定性观点具有重要意义:范德兰(Van der Laan)似乎描述了这种类型,我们需要将所有这些类型的不确定性降低到零,以便不再需要划分。一个真正的“精确”模型将始终具有1的概率和可能性值,非特异性得分为0,并且在术语定义,值范围或度量范围中都没有不确定性。在其他证据来源中不会有矛盾。这种模型所做的预测将始终是100%准确的;预测模型从本质上将其不确定性分配到了未来,但是没有什么可以推迟的。不确定性观点具有重要意义:一个真正的“精确”模型将始终具有1的概率和可能性值,非特异性得分为0,并且在术语,值的范围或度量范围的定义中没有任何不确定性。在其他证据来源中不会有矛盾。这种模型所做的预测将始终是100%准确的;预测模型从本质上将其不确定性分配到了未来,但是没有什么可以推迟的。不确定性观点具有一些重要含义:一个真正的“精确”模型将始终具有1的概率和可能性值,非特异性得分为0,并且在术语,值的范围或度量范围的定义中没有任何不确定性。在其他证据来源中不会有矛盾。这种模型所做的预测将始终是100%准确的;预测模型从本质上将其不确定性分配到了未来,但是没有什么可以推迟的。不确定性观点具有一些重要含义:这种模型所做的预测将始终是100%准确的;预测模型从本质上将其不确定性分配到了未来,但是没有什么可以推迟的。不确定性观点具有一些重要含义:这种模型所做的预测将始终是100%准确的;预测模型从本质上将其不确定性分配到了未来,但是没有什么可以推迟的。不确定性观点具有一些重要含义:

•这种高要求不仅在物理上令人难以置信,而且在逻辑上实际上是不可能的。显然,通过使用易犯错误的物理科学设备收集有限的观测值,我们无法获得无穷小程度的完美连续测量尺度。在测量规模方面总会有一些不确定性。同样,我们在实验中使用的定义总是会有些模糊。未来也具有内在的不确定性,因此我们对“精确”模型的所谓完美预测必须被视为不完美的,除非另行证明-这将需要永恒。

•更糟糕的是,在此过程中的某个时刻,没有一种测量技术能够百分百没有误差,也不能使其足够全面以涵盖宇宙中所有可能冲突的信息。此外,如果不检查所有影响我们正在检查的物理过程以及影响这些次要过程的物理过程,就不可能彻底证明消除可能的混淆变量和完全的条件独立性。

•精确性仅在纯逻辑及其子集(数学)中才有可能,正是因为抽象与现实世界的关注点(如这些不确定性源)不同。例如,通过纯演绎逻辑,我们可以证明2 + 2 = 4,而其他任何答案都是100%错误的。我们还可以做出完全精确的预测,使其始终等于4。只有在处理抽象时,此类精度才可能在统计数据中实现。当将统计信息应用于现实世界时,它是非常有用的,但使之有用的东西至少会注入一定程度的不可避免的不确定性,从而使其变得不精确。这是不可避免的困境。

•此外,Peter Chu在链接的文章rvl的注释部分中提出了其他限制。他说得比我更好:

“ NP难题的解决方案表面通常充斥着许多局部最优解,在大多数情况下,要解决该问题在计算上是不可行的,也就是说,通常无法找到全局最优解。因此,每个建模者都在使用某些(启发式)建模技术,充其量只能在这个复杂目标函数的广阔解空间中找到足够的局部最优解。”

•所有这些都意味着科学本身不可能完全准确,尽管范德兰在他的文章中似乎是这样说的。作为抽象过程的科学方法是可以精确定义的,但是不可能实现通用且完美的精确测量,这意味着它无法生成没有不确定性的精确模型。科学是一个伟大的工具,但是有其局限性。

•从那里开始变得更糟:即使可以精确测量作用在宇宙中每个夸克和胶子上的所有力,仍然存在一些不确定性存在。首先,由于存在五次方程和高阶多项式的多重解,因此由这样一个完整模型做出的任何预测仍将是不确定的。其次,我们不能完全确定经典问题“也许这是所有的梦想或幻觉”中体现的极端怀疑论并不是对现实的反映-在这种情况下,我们所有的模型确实以最糟糕的方式是错误的。这基本上相当于对诸如现象主义,唯心主义和唯心主义之类的哲学的原始认识论表述进行更为极端的本体论解释。

•在他1909年的经典《正教》中切斯特顿(GK Chesterton)指出,确实可以判断这些哲学的极端形式,但是可以通过是否将其信徒带入心理机构来判断。例如,本体论唯亲主义实际上是精神分裂症的标志,就像它的一些表亲一样。我们在这个世界上可以取得的最好成绩是消除合理的怀疑;即使在假设的精确模型世界中,也无法严格消除这种令人不安的疑问,即使是精确的模型,详尽且无差错的测量。如果范德兰(van der Laan)的目标是消除我们的不合理怀疑,那么他就是在玩火。把握完美,我们能做的有限的善事就会在我们的手指间溜走。我们是存在于无限世界中的有限生物,这意味着范德兰主张的那种完全而完全确定的知识永远是我们无法掌握的。我们达到那种确定性的唯一方法是,从那个世界退回到我们称为“纯数学”的完全抽象的狭义范围内。但是,这并不意味着退回到纯数学是消除不确定性的解决方案。这实质上是路德维希·维特根斯坦(Ludwig Wittgenstein,1889-1951)的继任者所采取的方法,他通过完全拒绝形而上学并将其完全退缩为纯粹的数学和科学主义以及极端怀疑主义,耗尽了其具有任何常识的逻辑实证主义哲学,过度专业化和过分强调准确性而不是有用性。在此过程中,他们通过将哲学学科分解为对定义和肚脐凝视的混乱状态而破坏了哲学学科,从而使其与其他学术界无关。这从根本上杀死了整个学科,直到20世纪初,该学科一直处于学术辩论的最前沿,直到现在它仍然引起了媒体的关注,并且它的一些领导人是家喻户晓的人物。他们抓住了这个世界的完美,优美的解释,它滑过了手指-就像GKC所说的精神病患者所做的那样。范德·兰(Van der Laan)的把握也将落空,后者已经证明了自己的观点,如下所述。追求过于精确的模型不仅是不可能的。如果直言不讳,那将是危险的。对这种纯洁的追求很少能顺利完成。它常常像那些细菌擦洗手一样疯狂,以至于最终导致伤口被感染。它' 让人想起伊卡洛斯(Icarus)试图从太阳偷火:作为有限的存在,我们只能对事物有有限的了解。正如切斯特顿在正教中所说的那样:“是逻辑学家试图将诸葛亮带入他的脑袋。而那是他的脑袋裂开了。”

鉴于上述,让我解决rvl列出的一些具体问题:

1)没有假设的模型要么a)不了解其自身的假设,要么b)必须与引入不确定性的考虑(例如测量误差,考虑每个可能的混杂变量,完美连续的测量标度和喜欢。

2)关于最大似然估计(MLE),我仍然是一个新手,因此我无法对目标似然的机制进行评论,除非指出明显的事实:似然只是那个,一种可能性,而不是确定性。要导出精确模型,需要完全消除不确定性,而概率逻辑很少会做到(如果有的话)。

3)当然不是。由于所有模型都存在一定的不确定性,因此不精确(纯数学的情况除外,与现实世界中的物理测量结果不同),因此人类迄今将无法取得任何技术进步,或者实际上无法取得任何其他进步。所有。如果不精确的模型总是无用的,那么我们将在一个洞穴中进行对话,而不是依靠这种不可思议的技术壮举,即互联网,这一切都可以通过不精确的建模来实现。

具有讽刺意味的是,范德兰自己的模型是不精确性的一个主要例子。他自己的文章勾勒出一种模型,说明应如何管理统计领域,以建立精确的模型为目标。这个“模型”还没有数字,他现在还没有衡量大多数模型有多不精确或无用,也没有量化我们离他的视野有多远,但是我想一个人可以为这些事情设计测试。但是,按照目前的情况,他的模型并不精确。如果没有用,就说明他的观点是错误的。如果有用的话,那就打破了他的主要观点,即不精确的模型没有用。无论哪种方式,他都反对自己的论点。

4)可能不是,因为我们无法获得用于测试模型的完整信息,出于同样的原因,我们不能一开始就得出精确的模型。根据定义,一个精确的模型将需要完美的可预测性,但是即使前100个测试的结果是100%准确,第101个测试也可能不需要。然后就是无穷小测量标尺的整个问题。之后,我们进入所有其他不确定性来源,这将污染对象牙塔模型的任何象牙塔评估。

5)为了解决这个问题,我不得不将它放在通常有争议的更大的哲学问题的更广泛的背景下,所以我认为没有征求意见就不可能讨论这个问题(请注意,这本身就是另一个问题)不确定性来源),但您是对的,本文值得您答复。他在其他主题上所说的很多话都是正确的,例如需要使统计数据与大数据相关,但其中存在一些不切实际的极端主义,应予以纠正。


1
这些“破坏了哲学学科”的“维特根斯坦继任者”是谁?战后分析哲学的发展趋势-认为后期维特根斯坦,奥斯汀,奎因,肯尼·古德曼,刘易斯,戴维森,罗蒂的-似乎是排斥逻辑实证主义,形而上学的康复,及一退的信条,从科学主义。(罗蒂对尼采和洛约拉的评论暗示他可能同意切斯特顿的观点。)关于为什么金·卡戴珊是家喻户晓的名字而不是Saul Kripke,我怀疑自20世纪初以来,其他趋势还在起作用。
Scortchi-恢复莫妮卡

这些战后的改革者在他们的领域之外是未知的,恰恰是因为他们是在20世纪30年代该学科退缩之后(经过一个世纪的衰落,极端逻辑实证主义者只是加速了发展)而变得无足轻重。损坏已经完成。到上世纪50年代,其他学术学科不再寻求领导哲学,并且从此以后就经常以嘲讽,嘲讽的方式对待哲学。我希望那是不对的。图像可能无法反映哲学的现实,但污点仍然存在。
SQLServerSteve

如果您有时间,我很乐意在下周的聊天中讨论这个问题,我不想在这个话题上切线,但是我怀疑我们的立场相差无几。我认为您是完全正确的,自20世纪初期以来,导致卡戴珊(Kardashian)等人的运动一直在进行-恰恰是哲学学科日趋衰落的时候(是否应得是另一回事;我认为这很重要)实用,希望它仍然受到高度重视)。
SQLServerSteve

评论不作进一步讨论;此对话已转移至聊天
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.