在有向无环图中表示交互作用


17

有向无环图(DAG;例如Greenland等,1999)是因果关系反事实解释的因果形式化形式的一部分。在这些图中从变量的箭头的存在可变断言可变直接引起(在危险情况时),可变,和如果没有这样一个箭头的断言,可变不直接原因(在风险的某些变化的)可变。一种一种一种

例如,在下面的DAG因果图中,从“烟草烟雾暴露”到“间皮瘤”的黑色箭头表示“吸烟直接导致间皮瘤风险”的说法。

同样,在下面的DAG因果图中,从“石棉暴露”到“间皮瘤”的黑色箭头表示“石棉暴露直接导致间皮瘤风险的改变” 。

由于红色箭头,我使用术语DAG来描述以下因果关系图,我打算断言诸如“石棉暴露引起烟草烟雾暴露对间皮瘤风险的直接因果效应发生变化 ”(石棉确实对肺细胞的损害,除了直接引起间皮瘤风险的改变外,还使这些细胞更容易受到烟草烟雾暴露的致癌性损害,结果是,接触石棉和烟草都会导致吸烟增加。风险大于两个单独风险的总和),并且这与我在问题开始时描述的DAG中因果箭头的形式含义不太吻合(即,因为红色箭头未终止于变量中))。

非有向无环图:烟草烟雾暴露引起间皮瘤风险增加; 接触石棉会导致间皮瘤风险增加; 接触石棉会增加烟草对间皮瘤风险的因果作用。

如何在DAG的视觉形式主义中正确表示交互作用?

参考文献

格陵兰,S。,珍珠,J。和罗宾斯,JM(1999)。流行病学研究因果图流行病学,10(1):37-48。


是否有可能通过添加一个针对肺细胞损伤的结节,从烟草和石棉指向内的箭头以及向间皮瘤向外的箭头来改变DAG?这样既可以保留DAG,又可以灵活地对单个和复合效果进行建模。
John Woolf 2015年

是的,我曾想过类似的事情,但我想知道这是否还意味着烟草的主要作用还不是“肺细胞损伤”(当发生时)。我想可以添加由烟草和石棉引起的另一变量“烟草和石棉在一起”,但这似乎很笨拙……但这也许是必须解决的问题。
亚历克西斯(Alexis)

您使用什么软件来创建图形?
zipzapboing

@zipzapboing用MS Word或PageStream或Scribus或其他东西手工绘制它,然后使用GIMP编辑颜色和透明度。(这实际上是我一些演讲幻灯片的摘录。)
Alexis

Answers:


9

珀尔的因果关系理论完全是非参数的。因此,无论是在图形中还是在其表示的结构方程式中,都没有明确规定交互作用。但是,因果关系的影响可能会因假设而发生很大变化。

如果识别出一种效应,并且从非参数数据中对其进行估计,则将获得因果效应的完整分布(而不是单个参数)。因此,您可以非参数地评估有条件的烟草接触对石棉接触的因果影响,以查看其是否发生变化,而无需使用任何功能形式。

让我们看一下您的情况下的结构方程式,它对应于用红色箭头去除的“ DAG”:

F1ϵ

F2ϵŤ

F3ϵ一种

ϵ

我们没有指定各个函数f()和错误的分布,只是说后者是独立的。但是,我们可以应用Pearl理论并立即指出,烟草和石棉暴露对间皮瘤的因果关系已被确定。这意味着,如果我们从此过程中获得无数次观察结果,则只需简单地查看不同暴露水平个体的间皮瘤发病率,就可以准确地测量将暴露水平设置为不同水平的效果。因此,我们可以进行因果关系而无需进行实际实验。这是因为从暴露变量到结果变量不存在后门路径。

所以你会得到

P(间皮瘤| do(烟草= t))= P(间皮瘤|烟草= t)

石棉的因果关系也采用相同的逻辑,因此您可以简单地评估:

P(间皮瘤|烟草= t,石棉= a)-P(间皮瘤|烟草= t',石棉= a)

相较于

P(间皮瘤|烟草= t,石棉= a')-P(间皮瘤|烟草= t',石棉= a')

对于t和a的所有相关值,以估计交互作用。

在您的具体示例中,我们假设结果变量是Bernoulli变量-您可以患有间皮瘤,也可以不患有间皮瘤-并且一个人的石棉水平很高。然后,他很有可能会患间皮瘤;因此,增加烟草接触的影响将非常低。另一方面,如果石棉含量a'非常低,则增加烟草暴露量将产生更大的影响。这将构成烟草和石棉效应之间的相互作用。

当然,在有限数据以及大量不同的t和a值的情况下,非参数估计可能会非常苛刻且嘈杂,因此您可能会考虑在f()中采用某种结构。但基本上您可以做到这一点。


朱利安(Julian),感谢您深入了解Pearl的反对因果关系逻辑。您的答案将通过说话的改善的互作效应可视化表示,这是中央对我的问题(也许说“的DAG不犯互动效应明显,”或者你有什么。)
亚历克西斯

1
你是对的; 我从一开始就试图将其弄清楚。
朱利安·舒斯勒

朱利安,太好了。您说DAG的构建块不是单独的链接C = f(D),而是更一般的链接集C = f(D,E,...)。我的问题是,Pearl有时对此含糊不清,例如在他的Def 2.2.1的“因果关系”中:“一组变量V的因果结构是DAG,其中每个节点对应于V的不同元素,每个链接表示相应变量之间的直接功能关系。” 当然,从C的父母到C的个人联系本身并没有任何意义,它们只是表明参与了对C的集体影响。您会同意吗?
史蒂夫·鲍威尔

是。C = f(D,E)将在图中从D / E到C的两个链接显示。链接的解释是D和E确定C。因此,链接当然是关系性的。
朱利安·舒斯勒

10

简单的答案是您已经这样做了。常规DAG不仅代表主要作用,而且代表主要作用和相互作用的组合。绘制DAG后,您已经假定指向同一结果的任何变量都可以修改其他指向同一结果的变量的效果。这是一个独立于DAG的建模假设,它假定缺少交互。

此外,可以在模型中不包含显式交互项的情况下进行交互。如果仅在模型中将Y相对于治疗T和协变量Q的风险比包括主要影响,则对风险差异的估计将根据Q的水平而有所不同。为了非参数地容纳所有这些可能性,DAG会做出只有对变量之间关系的函数形式的最弱假设,并且假设没有交互作用,则是允许交互作用的更强假设。再次说,DAG已经允许进行交互而无需任何调整。有关使用常规DAG但允许进行交互的交互的讨论,请参见Vanderweele(2009)。

Bollen&Paxton(1998)和Muthén&Asparouhov(2015)都展示了具有潜在变量的路径模型中的相互作用,但这些相互作用明确地指代参数模型中的产品术语,而不是广义上的相互作用。我还看到了与您相似的图,其中因果箭头指向路径,但严格来说,路径并不是变量可能对因果产生影响的唯一量(即使这可能是我们要解释模型的方式) ; 它只是表示因果关系的存在,而不是其大小。


Bollen,KA和Paxton,P.(1998年)。结构方程模型中潜在变量的相互作用。结构方程建模:多学科期刊,5(3),267-293。

Muthén,B.,&Asparouhov,T.(2015年)。潜在变量交互。

范德威勒(TJ)(2009)。关于交互作用与效果修饰的区别。流行病学,20(6),863-871。


3
另外:“绘制了DAG之后,您已经假定指向相同结果的任何变量都可以修改其他指向相同结果的变量的效果。这是与DAG分开的建模假设,假定缺少DAG。互动。” 非常出色 ...确实帮助了这些想法。
Alexis
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.