我相信您的问题会很快得到一句话答复,
什么时候适合控制变量Y,什么时候不适合?
是“后门标准”。
茱迪亚·珀尔(Judea Pearl)的结构因果模型可以明确地告诉您哪些变量足以(以及何时需要)进行调节,以推断一个变量对另一个变量的因果影响。即,这是通过后门准则来回答的,这在Pearl 的本综述论文的第19页中进行了描述。
主要警告是它要求您了解变量之间的因果关系(以图形中的方向箭头的形式)。没有办法解决。这是困难和可能的主观性可以发挥作用的地方。Pearl的结构因果模型仅允许您知道在给定因果模型(即有向图)的情况下如何回答正确的问题,给定数据分布可能的那组因果模型或如何通过执行正确的实验来寻找因果结构。仅告诉数据分布,它并没有告诉您如何找到正确的因果结构。实际上,它声称如果不使用有关变量含义的外部知识/直觉,这是不可能的。
后门标准可以描述如下:
为了找到的因果影响上ÿ ,一组可变的节点小号是足以对被调节的,只要其满足以下标准两者:XY,S
1)没有元素是X的后代SX
2)阻止X和Y之间的所有 “后门”路径SXY
在这里,“后门”路径只是箭头的路径,该路径以开头并以指向X的箭头结尾。(所有其他箭头指向的方向并不重要。)“阻塞”本身就是具有特定含义的标准,在上面链接的第11页中给出了该标准。这与学习“ D分离”时所阅读的标准相同。我个人发现,Bishop的模式识别和机器学习的第8章描述了D分离中的阻塞概念,远比我上面链接的Pearl来源更好。但是它是这样的:YX.
一组节点,的块之间的路径X和ÿ如果它满足以下标准的至少一个:S,XY
1)一个在路径中的节点,这也是在发射至少路径上的一个箭头(即箭头所指从节点的距离)S,
2)既不是在一个节点也不在一个节点的祖先小号具有在路径“碰撞”向它(即满足它的两个箭头的头-头)SS
这是一个or准则,与一般后门准则and准则不同。
要清楚了解后门准则,它告诉您的是,对于给定的因果模型,当以足够的变量为条件时,您可以从数据的概率分布中了解因果影响。(我们知道,仅联合分布不足以查找因果行为,因为多个因果结构可能导致相同的分布。这就是为什么也需要因果模型的原因。)可以使用普通统计/机器学习方法上的观测数据。所以只要你知道 如果因果结构允许以一个变量(或一组变量)为条件,则您对一个变量对另一个变量的因果影响的估计与通过统计方法获得的数据分布的估计一样好。
将后门条件应用于您的两个图时,我们会发现以下内容:
ZX.YYX,Y
YXZXYYYZ.YY.X.YYYXY
YYXZ.
YX.ZX.
Z←Y→XZ←W→B←A→X. YY B,B,YZ←Y→X
Z←W→B→Y→X. Y Z←Y→XZ←W→B←A→X,B.
YAWXZB.XZB,BAWBAWXZ
如前所述,使用后门标准要求您了解因果模型(即变量之间箭头的“正确”图)。但是在我看来,结构因果模型还提供了最佳,最正式的方式来搜索这样的模型,或者知道什么时候搜索是徒劳的。它还具有使“混淆”,“调解”和“虚假”(所有这些令我感到困惑)之类的术语过时的奇妙副作用。只要给我看照片,我就会告诉你应该控制哪个圆圈。