操作对应于对变量的干预,该干预将其设置为X xdo(x)Xx。当我们干预,这种手段的父母不影响它的价值了,这相当于删除指向箭头。所以,让我们代表了一个新的DAG这种干预。X XXXX
我们将其称为原始观察分布 和干预后分布。我们的目标是要表达来讲。请注意,在我们有一个。另外,干预前和干预后概率共享这两个不变性:和因为我们没有碰过在我们的干预措施中输入这些变量的任何箭头。所以:P * P * P P * ù ⊥ X P *(Û )= P (Û )P *(Ý | X ,Ù )= P (Ý | X ,ù )PP∗P∗PP∗U⊥XP∗(U)=P(U)P∗(Y|X,U)=P(Y|X,U)
P(Y|do(X)):=P∗(Y|X)=∑UP∗(Y|X,U)P∗(U|X)=∑UP∗(Y|X,U)P∗(U)=∑UP(Y|X,U)P(U)
前门的派生比较复杂。首先请注意,和之间没有混淆,因此,XZ
P(Z|do(X))=P(Z|X)
同样,使用相同的逻辑来推导我们看到对控制足以推导对,即P(Y|do(X))XZY
P(Y|do(Z))=∑X′P(Y|X′,Z)P(X′)
我在哪里使用质数表示法方便下一个表达式。因此,这两个表达式已经按照干预前的分布进行了描述,我们仅使用了先前的后门原理就可以得出它们。
我们需要的最后一部分是结合对和对的影响来推断对的影响。为此,请注意我们的图形,因为的影响上的完全由介导,并且在进行干预时,从到的后门路径被阻止。因此:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX
P(Y|do(X))=∑ZP(Y|Z,do(X))P(Z|do(X))=∑ZP(Y|do(Z))P(Z|do(X))=∑Z∑X′P(Y|X′,Z)P(X′)P(Z|X)=∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)
凡可以通过以下方式来理解:当我在介入,然后分配更改为;但是我实际上是在干预所以我想知道当我更改时多久采用一次特定值,即。∑ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))
因此,正如我们所显示的,两次调整在该图上为您提供了相同的干预后分布。
重新阅读您遇到的问题对我来说,您可能有兴趣直接显示两个方程的右手边在干预前的分布中是相等的(鉴于我们先前的推导,它们必须是相等的)。直接显示也不难。只需在DAG中显示即可:
∑X′P(Y|Z,X′)P(X′)=∑UP(Y|Z,U)P(U)
注意,DAG暗示和然后:Y⊥X|U,ZU⊥Z|X
∑X′P(Y|Z,X′)P(X′)=∑X′(∑UP(Y|Z,X′,U)P(U|Z,X′))P(X′)=∑X′(∑UP(Y|Z,U)P(U|X′))P(X′)=∑UP(Y|Z,U)∑X′P(U|X′)P(X′)=∑UP(Y|Z,U)P(U)
因此:
∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)=∑ZP(Z|X)∑UP(Y|Z,U)P(U)=∑UP(U)∑ZP(Y|Z,U)P(Z|X)=∑UP(U)∑ZP(Y|Z,X,U)P(Z|X,U)=∑UP(Y|X,U)P(U)