因果阶梯中的梯级2和3之间的差异

12

在朱迪亚·珀尔（Judea Pearl）的《为什么书》中，他谈到了他所谓的因果阶梯，这实质上是一个由不同层次的因果推理组成的等级体系。最低的是与观察到的数据中的关联模式有关（例如，相关性，条件概率等），第二个与干预有关（如果我们以某种预定的方式故意改变数据生成过程会发生什么？），第三个是反事实（如果某件事发生或未发生，在另一个可能的世界中会发生什么）？

我不明白的是，梯级2和3有何不同。如果我们提出反事实的问题，我们不是简单地提出有关干预的问题，以否定观察到的世界的某些方面吗？

causality

— 达克斯顿
source

这真的是话题吗？出于好奇而问

— Firebug

5

@Firebug是话题的因果关系吗？如果要计算反事实的概率（例如某种特定药物足以使某人死亡的概率），则需要了解这一点。

— 卡洛斯·辛纳利

5

twitter.com/yudapearl/status/1069533953223155713！

— 蒂姆

13

在干预层面，事实世界与利益行动之间没有矛盾。例如，直到今天吸烟和从明天开始被迫戒烟并不矛盾，即使您可以说一个“否定”另一个。但现在想象一下以下情况。您知道乔，一个终生吸烟者，患有肺癌，并且您想知道：如果乔三十年来没有吸烟，他今天会健康吗？在这种情况下，我们在同一时间与同一个人打交道，想象一种情况，即行动和结果与已知事实直接矛盾。

因此，干预和反事实的主要区别在于，在干预中，您要问的是，如果您执行某项操作，平均会发生什么；而在反事实中，您要问的是，如果您在特定情况下采取了不同的措施，将会发生什么？，因为您已掌握实际情况。请注意，由于您已经知道现实世界中发生的事情，因此需要根据观察到的证据来更新有关过去的信息。

这两种类型的查询在数学上是不同的，因为它们需要回答不同级别的信息（反事实者需要更多信息来回答），甚至需要表达更复杂的语言！

借助回答第3级问题所需的信息，您可以回答第2级问题，但不能反过来。更准确地说，您不能仅凭干预信息来回答反事实问题。在CV中已经给出了干预和反事实冲突发生的示例，请参见此帖子和该帖子。但是，出于完整性考虑，我还将在此处包括一个示例。

以下示例可在因果关系第1.4.4节中找到。

$x =1$ $x=0$ $y=0$ $y=1$ $P(y|x) = 0.5~~~\forall x,y$

$P(Y = 1|do(X = 1)) - P(Y=1|do(X =0) = 0$

$P(Y_{0} = 0|X =1, Y = 1)$

仅凭您拥有的干预数据无法回答这个问题。证明很简单：我可以创建两个不同的因果模型，它们将具有相同的干预分布，但具有不同的反事实分布。下面提供了两者：

$U$ $P(y, x)$

请注意，在第一个模型中，没有人受到治疗的影响，因此，在接受治疗的情况下死亡的患者中，如果不接受治疗，本可以恢复的百分比为零。

但是，在第二种模型中，每个患者都受到治疗的影响，并且我们有两个人口的混合物，其中平均因果关系结果为零。在此示例中，事实相反的数量现在达到100％---在模型2中，如果不接受治疗，所有在治疗中死亡的患者都可以康复。

因此，梯级2和梯级3有着明显的区别。如示例所示，仅凭有关干预措施的信息和假设就无法回答反事实问题。通过计算反事实的三个步骤可以很清楚地看出这一点：

步骤1（诱拐）：更新未观察到的因子的概率 $P(u)$ $P(u|e)$
$do(x))$
$Y$

如果没有因果模型的一些功能信息，或者没有关于潜在变量的信息，这将无法进行计算。

— 卡洛斯·辛内利
source

有趣的答案！接下来的几个步骤：1）您说“ 有了Rung 3信息，您可以回答Rung 2问题，但不能反过来 ”。但是，在您的吸烟示例中，我不知道如何知道乔如果从未吸烟过是否健康，就回答了一个问题“如果吸烟30年后明天戒烟，他会健康吗”。它们似乎是不同的问题，所以我认为我缺少了一些东西。

— mkt-恢复莫妮卡'18

另外，您的后续工作示例还依赖于2个未观察到的变量在治疗和对照之间的随机分布。但是您将其描述为随机实验-那么这不是不良随机情况吗？有了适当的随机化，除非我缺少基本知识，否则我看不到如何得到两个这样的不同结果。

— mkt-恢复莫妮卡'18

@mkt从最后到第一个。未观察到的变量在治疗和对照之间随机分布，您的两臂u类别中恰好有50％。所谓信息，是指通常回答反事实查询所需的模型的部分规范，而不是特定查询的答案。要回答反事实查询，您需要因果结构+一些功能信息或潜在变量的分布信息。

— 卡洛斯·辛纳利

0

这是Judea Pearl 在Twitter上给出的答案：

读者问：为什么干预（Rung-2）与反事实（Rung-3）不同？干预不会否定被观察世界的某些方面吗？

Ans。干预措施会发生变化，但并不与观察到的世界相矛盾，因为干预之前和之后的世界需要时变变量。相反，“我已经死了”与已知事实相矛盾。有关最新讨论，请参见此讨论。

备注：哈佛的#causalinference组和鲁宾的潜在结果框架都没有区分Rung-2和Rung-3。

我认为，这是一种具有文化根源的抵制，将来会得到纠正。它源自两个框架在“好像随机化”的隐喻中的起源，与#Bookofwhy的物理“侦听”隐喻相反

— 本杰明·克鲁兹耶（Benjamin Crouzier）
source