因果阶梯中的梯级2和3之间的差异


12

在朱迪亚·珀尔(Judea Pearl)的《为什么书》中,他谈到了他所谓的因果阶梯,这实质上是一个由不同层次的因果推理组成的等级体系。最低的是与观察到的数据中的关联模式有关(例如,相关性,条件概率等),第二个与干预有关(如果我们以某种预定的方式故意改变数据生成过程会发生什么?),第三个是反事实(如果某件事发生或未发生,在另一个可能的世界中会发生什么)?

我不明白的是,梯级2和3有何不同。如果我们提出反事实的问题,我们不是简单地提出有关干预的问题,以否定 观察到的世界的某些方面吗?


这真的是话题吗?出于好奇而问
Firebug

5
@Firebug是话题的因果关系吗?如果要计算反事实的概率(例如某种特定药物足以使某人死亡的概率),则需要了解这一点。
卡洛斯·辛纳利

Answers:


13

在干预层面,事实世界与利益行动之间没有矛盾。例如,直到今天吸烟和从明天开始被迫戒烟并不矛盾,即使您可以说一个“否定”另一个。但现在想象一下以下情况。您知道乔,一个终生吸烟者,患有肺癌,并且您想知道:如果乔三十年来没有吸烟,他今天会健康吗?在这种情况下,我们在同一时间与同一个人打交道,想象一种情况,即行动和结果与已知事实直接矛盾。

因此,干预和反事实的主要区别在于,在干预中,您要问的是,如果您执行某项操作,平均会发生什么;而在反事实中,您要问的是,如果您在特定情况下采取了不同的措施,将会发生什么? ,因为您已掌握实际情况。请注意,由于您已经知道现实世界中发生的事情,因此需要根据观察到的证据来更新有关过去的信息。

这两种类型的查询在数学上是不同的,因为它们需要回答不同级别的信息(反事实者需要更多信息来回答),甚至需要表达更复杂的语言!

借助回答第3级问题所需的信息,您可以回答第2级问题,但不能反过来。更准确地说,您不能仅凭干预信息来回答反事实问题。在CV中已经给出了干预和反事实冲突发生的示例,请参见此帖子该帖子。但是,出于完整性考虑,我还将在此处包括一个示例。

以下示例可在因果关系第1.4.4节中找到

x=1x=0y=0y=1P(y|x)=0.5   x,y

P(Y=1|do(X=1))P(Y=1|do(X=0)=0

P(Y0=0|X=1,Y=1)

仅凭您拥有的干预数据无法回答这个问题。证明很简单:我可以创建两个不同的因果模型,它们将具有相同的干预分布,但具有不同的反事实分布。下面提供了两者:

在此处输入图片说明

UP(y,x)

请注意,在第一个模型中,没有人受到治疗的影响,因此,在接受治疗的情况下死亡的患者中,如果不接受治疗,本可以恢复的百分比为零。

但是,在第二种模型中,每个患者都受到治疗的影响,并且我们有两个人口的混合物,其中平均因果关系结果为零。在此示例中,事实相反的数量现在达到100%---在模型2中,如果不接受治疗,所有在治疗中死亡的患者都可以康复。

因此,梯级2和梯级3有着明显的区别。如示例所示,仅凭有关干预措施的信息和假设就无法回答反事实问题。通过计算反事实的三个步骤可以很清楚地看出这一点:

  1. 步骤1(诱拐):更新未观察到的因子的概率P(u)P(u|e)
  2. do(x))
  3. Y

如果没有因果模型的一些功能信息,或者没有关于潜在变量的信息,这将无法进行计算。


有趣的答案!接下来的几个步骤:1)您说“ 有了Rung 3信息,您可以回答Rung 2问题,但不能反过来 ”。但是,在您的吸烟示例中,我不知道如何知道乔如果从未吸烟过是否健康,就回答了一个问题“如果吸烟30年后明天戒烟,他会健康吗”。它们似乎是不同的问题,所以我认为我缺少了一些东西。
mkt-恢复莫妮卡'18

另外,您的后续工作示例还依赖于2个未观察到的变量在治疗和对照之间的随机分布。但是您将其描述为随机实验-那么这不是不良随机情况吗?有了适当的随机化,除非我缺少基本知识,否则我看不到如何得到两个这样的不同结果。
mkt-恢复莫妮卡'18

@mkt从最后到第一个。未观察到的变量在治疗和对照之间随机分布,您的两臂u类别中恰好有50%。所谓信息,是指通常回答反事实查询所需的模型的部分规范,而不是特定查询的答案。要回答反事实查询,您需要因果结构+一些功能信息或潜在变量的分布信息。
卡洛斯·辛纳利

0

这是Judea Pearl 在Twitter上给出的答案:

读者问:为什么干预(Rung-2)与反事实(Rung-3)不同?干预不会否定被观察世界的某些方面吗?

Ans。干预措施会发生变化,但并不与观察到的世界相矛盾,因为干预之前和之后的世界需要时变变量。相反,“我已经死了”与已知事实相矛盾。有关最新讨论,请参见此讨论

备注:哈佛的#causalinference组和鲁宾的潜在结果框架都没有区分Rung-2和Rung-3。

我认为,这是一种具有文化根源的抵制,将来会得到纠正。它源自两个框架在“好像随机化”的隐喻中的起源,与#Bookofwhy的物理“侦听”隐喻相反

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.