在朱迪亚·珀尔(Judea Pearl)的《为什么书》中,他谈到了他所谓的因果阶梯,这实质上是一个由不同层次的因果推理组成的等级体系。最低的是与观察到的数据中的关联模式有关(例如,相关性,条件概率等),第二个与干预有关(如果我们以某种预定的方式故意改变数据生成过程会发生什么?),第三个是反事实(如果某件事发生或未发生,在另一个可能的世界中会发生什么)?
我不明白的是,梯级2和3有何不同。如果我们提出反事实的问题,我们不是简单地提出有关干预的问题,以否定 观察到的世界的某些方面吗?
在朱迪亚·珀尔(Judea Pearl)的《为什么书》中,他谈到了他所谓的因果阶梯,这实质上是一个由不同层次的因果推理组成的等级体系。最低的是与观察到的数据中的关联模式有关(例如,相关性,条件概率等),第二个与干预有关(如果我们以某种预定的方式故意改变数据生成过程会发生什么?),第三个是反事实(如果某件事发生或未发生,在另一个可能的世界中会发生什么)?
我不明白的是,梯级2和3有何不同。如果我们提出反事实的问题,我们不是简单地提出有关干预的问题,以否定 观察到的世界的某些方面吗?
Answers:
在干预层面,事实世界与利益行动之间没有矛盾。例如,直到今天吸烟和从明天开始被迫戒烟并不矛盾,即使您可以说一个“否定”另一个。但现在想象一下以下情况。您知道乔,一个终生吸烟者,患有肺癌,并且您想知道:如果乔三十年来没有吸烟,他今天会健康吗?在这种情况下,我们在同一时间与同一个人打交道,想象一种情况,即行动和结果与已知事实直接矛盾。
因此,干预和反事实的主要区别在于,在干预中,您要问的是,如果您执行某项操作,平均会发生什么;而在反事实中,您要问的是,如果您在特定情况下采取了不同的措施,将会发生什么? ,因为您已掌握实际情况。请注意,由于您已经知道现实世界中发生的事情,因此需要根据观察到的证据来更新有关过去的信息。
这两种类型的查询在数学上是不同的,因为它们需要回答不同级别的信息(反事实者需要更多信息来回答),甚至需要表达更复杂的语言!
借助回答第3级问题所需的信息,您可以回答第2级问题,但不能反过来。更准确地说,您不能仅凭干预信息来回答反事实问题。在CV中已经给出了干预和反事实冲突发生的示例,请参见此帖子和该帖子。但是,出于完整性考虑,我还将在此处包括一个示例。
以下示例可在因果关系第1.4.4节中找到。
仅凭您拥有的干预数据无法回答这个问题。证明很简单:我可以创建两个不同的因果模型,它们将具有相同的干预分布,但具有不同的反事实分布。下面提供了两者:
请注意,在第一个模型中,没有人受到治疗的影响,因此,在接受治疗的情况下死亡的患者中,如果不接受治疗,本可以恢复的百分比为零。
但是,在第二种模型中,每个患者都受到治疗的影响,并且我们有两个人口的混合物,其中平均因果关系结果为零。在此示例中,事实相反的数量现在达到100%---在模型2中,如果不接受治疗,所有在治疗中死亡的患者都可以康复。
因此,梯级2和梯级3有着明显的区别。如示例所示,仅凭有关干预措施的信息和假设就无法回答反事实问题。通过计算反事实的三个步骤可以很清楚地看出这一点:
如果没有因果模型的一些功能信息,或者没有关于潜在变量的信息,这将无法进行计算。
这是Judea Pearl 在Twitter上给出的答案:
读者问:为什么干预(Rung-2)与反事实(Rung-3)不同?干预不会否定被观察世界的某些方面吗?
Ans。干预措施会发生变化,但并不与观察到的世界相矛盾,因为干预之前和之后的世界需要时变变量。相反,“我已经死了”与已知事实相矛盾。有关最新讨论,请参见此讨论。
备注:哈佛的#causalinference组和鲁宾的潜在结果框架都没有区分Rung-2和Rung-3。
我认为,这是一种具有文化根源的抵制,将来会得到纠正。它源自两个框架在“好像随机化”的隐喻中的起源,与#Bookofwhy的物理“侦听”隐喻相反