后门和前门调整的因果效应


12

如果要在下面的因果关系图中计算对的因果关系,则可以使用后门调整定理和前门调整定理,即 Y P y | doX = x = u P y | x u P u XY

P(y|do(X=x))=uP(y|x,u)P(u)

P(y|do(X=x))=zP(z|x)xP(y|x,z)P(x).

是否容易证明这两项调整导致对因果关系相同?ÿXY

图形


这是真正的作业吗?然后,请添加自学标签。然后人们可能会给您提示,将思想(和学习)留给您。告诉我们您尝试过什么以及遇到什么困难。请记住,简历不用于外包家庭作业……
Knarpie

5
嗨,Knarpie,这是自学的一部分,而不是家庭作业。我目前正在阅读Pearl等人的“统计中的因果推断”。并花了大约1个小时来思考以上问题,因为这是很自然的问题,但却无法体现平等。我在这里丢失了一些东西,或者两个表达式不相等。
Jae

Answers:


13

操作对应于对变量的干预,该干预将其设置为X xdo(x)Xx。当我们干预,这种手段的父母不影响它的价值了,这相当于删除指向箭头。所以,让我们代表了一个新的DAG这种干预。X XXXX

在此处输入图片说明

我们将其称为原始观察分布 和干预后分布。我们的目标是要表达来讲。请注意,在我们有一个。另外,干预前和干预后概率共享这两个不变性:和因为我们没有碰过在我们的干预措施中输入这些变量的任何箭头。所以:P * P * P P * ù X P *Û = P Û P *Ý | X Ù = P Ý | X ù PPPPPUXP(U)=P(U)P(Y|X,U)=P(Y|X,U)

P(Y|do(X)):=P(Y|X)=UP(Y|X,U)P(U|X)=UP(Y|X,U)P(U)=UP(Y|X,U)P(U)

前门的派生比较复杂。首先请注意,和之间没有混淆,因此,XZ

P(Z|do(X))=P(Z|X)

同样,使用相同的逻辑来推导我们看到对控制足以推导对,即P(Y|do(X))XZY

P(Y|do(Z))=XP(Y|X,Z)P(X)

我在哪里使用质数表示法方便下一个表达式。因此,这两个表达式已经按照干预前的分布进行了描述,我们仅使用了先前的后门原理就可以得出它们。

我们需要的最后一部分是结合对和对的影响来推断对的影响。为此,请注意我们的图形,因为的影响上的完全由介导,并且在进行干预时,从到的后门路径被阻止。因此:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX

P(Y|do(X))=ZP(Y|Z,do(X))P(Z|do(X))=ZP(Y|do(Z))P(Z|do(X))=ZXP(Y|X,Z)P(X)P(Z|X)=ZP(Z|X)XP(Y|X,Z)P(X)

凡可以通过以下方式来理解:当我在介入,然后分配更改为;但是我实际上是在干预所以我想知道当我更改时多久采用一次特定值,即。ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))

因此,正如我们所显示的,两次调整在该图上为您提供了相同的干预后分布。


重新阅读您遇到的问题对我来说,您可能有兴趣直接显示两个方程的右手边在干预前的分布中是相等的(鉴于我们先前的推导,它们必须是相等的)。直接显示也不难。只需在DAG中显示即可:

XP(Y|Z,X)P(X)=UP(Y|Z,U)P(U)

注意,DAG暗示和然后:YX|U,ZUZ|X

XP(Y|Z,X)P(X)=X(UP(Y|Z,X,U)P(U|Z,X))P(X)=X(UP(Y|Z,U)P(U|X))P(X)=UP(Y|Z,U)XP(U|X)P(X)=UP(Y|Z,U)P(U)

因此:

ZP(Z|X)XP(Y|X,Z)P(X)=ZP(Z|X)UP(Y|Z,U)P(U)=UP(U)ZP(Y|Z,U)P(Z|X)=UP(U)ZP(Y|Z,X,U)P(Z|X,U)=UP(Y|X,U)P(U)

2
这是一个非常好的和详尽的答案。但是,通过前门确定因果关系的部分是多余的(OP已经做到了,它直接遵循前门定理),并且还包含一个错误:没有“总定律”因果效应的可能性”。也就是说,通常不等于,而是,这显然是不同的。请参阅第87--88页的大珍珠书。– P(Y|do(X))ZP(Y|do(Z))P(Z|do(X)ZP(Y|Z,do(X))P(Z|do(X))
朱利安·

@JulianSchuessler这就是为什么我写“可以被认为是”来帮助理解的原因,但不是字面意思。关于前门派生,尚不清楚OP是否知道如何获得它,这就是为什么我把它放在那儿。
卡洛斯·辛纳利

好答案。谢谢,卡洛斯。答案的第二部分正是我所要的。我在这里有两个后续问题。1)您使用了哪种搜索策略来对第二个答案中的表达式进行代数运算?(通过在表达式上斜视足够长的时间?)由于搜索空间很大,我想知道如何编写一种算法以能够自动得出相同的结论。
Jae

2)我也对如何解释,因为我的第一个直觉就像朱利安的建议。我提到的等人的书使用了您的表达方式,我想知道,在一般情况下,当考虑有向链时,以开始节点为原因,结束节点为结果时,每个因素是否必须以 而不是,其中是链中的中间音符Z Z ZzP(Y|do(Z)P(Z|do(X))do(Z)ZZ
Jae

1
@Jeevaka,这是在DAG中编码的假设,由其分解和该系统由模块化的自治部件组成的假设所隐含。因此,变化不会影响。对此进行考虑的一种方法是写下模型(观测模型)和(干预模型)的结构方程,然后导出隐含分布和。您将看到,给定和的的条件在两者中都相同。P Y | X U M M * P P * Y X UP(X,U)P(Y|X,U)MMPPYXU
卡洛斯·辛纳利
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.