Questions tagged «causality»

因果关系。


1
后门和前门调整的因果效应
如果要在下面的因果关系图中计算对的因果关系,则可以使用后门调整定理和前门调整定理,即 Y P (y | do(X = x ))= ∑ u P (y | x ,u )P (u )XXXÿYYP(y| 做(X= x ))= ∑üP(y| X,ù)P(你)P(y|do(X=x))=∑uP(y|x,u)P(u)P(y | \textit{do}(X = x)) = \sum_u P(y | x, u) P(u) 和 P(y|do(X=x))=∑zP(z|x)∑x′P(y|x′,z)P(x′).P(y|do(X=x))=∑zP(z|x)∑x′P(y|x′,z)P(x′).P(y | \textit{do}(X = x)) = \sum_z P(z | x) \sum_{x'} P(y|x', z)P(x'). 是否容易证明这两项调整导致对因果关系相同?ÿXXXYYY

1
外行对后门调整和前门调整之间差异的理解
我指的是后门调整和前门调整在这里: 后门调整:统计学中的原型流行病学问题是调整被测混杂因素的影响。Pearl的后门准则概括了这个想法。 前门调整:如果未发现某些变量,则我们可能需要求助于其他方法来确定因果关系。 该页面还为上述两个术语提供了精确的数学定义。 根据上述数学定义,您如何让外行人了解后门调节和前门调节之间的区别?
12 causality  dag 

2
鲁宾因果模型中的无疑之处-莱曼的解释
在实施鲁宾的因果模型时,我们需要的(不可笑)假设之一是无混杂感,这意味着 (Y(0),Y(1))⊥T|X(Y(0),Y(1))⊥T|X(Y(0),Y(1))\perp T|X LHS是反事实,T是治疗方法,X是我们控制的协变量。 我想知道如何将其描述给对鲁宾因果模型了解不多的人。我理解为什么从理论上讲我们需要这个假设,但是从概念上我不确定为什么这很重要。具体来说,如果使用T作为治疗方法,那么潜在的结果是否应该非常依赖于它?同样,如果我们有一个随机对照试验,然后自动,(Y(0),Y(1))⊥T(Y(0),Y(1))⊥T(Y(0),Y(1))\perp T。为什么这适用呢? 您将如何向未学习RCM的人描述“无足轻重/无知”的假设?

1
工具变量如何解决选择偏见?
我想知道工具变量如何解决回归中的选择偏差。 这是我正在尝试的示例:在“ 大多数无害计量经济学”中,作者讨论了与服役和晚年收入有关的IV回归。问题是,“服兵役会增加还是减少未来的收入?” 他们在越南战争的背景下调查了这个问题。我知道不能随机分配兵役,这是因果推理的问题。 为了解决这个问题,研究人员使用了征兵资格(如“您的征兵号码被称为”)作为实际服兵役的工具。这是有道理的:越南选秀大会随机分配了年轻的美国士兵入伍(从理论上讲,选秀者是否真的对我的问题有所帮助)。我们的其他IV条件似乎是可靠的:征兵资格和实际服兵役之间有着密切的正相关关系。 这是我的问题。似乎您会出现自我选择偏见:也许较富有的孩子可以退出越南服务,即使他们的选秀号码被打电话了。(如果实际并非如此,为我的问题,让我们假装)。如果这种自我选择在我们的样本中造成系统性偏见,那么我们的工具变量如何解决这一偏见?我们是否必须将推论范围缩小到“无法逃脱草案的人的类型?” 还是IV以某种方式挽救了我们推论的那一部分?如果有人能解释它是如何工作的,我将非常感谢。

2
为什么使用横截面数据来推断/预测纵向变化是一件坏事?
我正在寻找希望存在的论文,但不知道是否存在。这可能是一组案例研究,和/或概率论的一个论据,关于为什么使用横截面数据来推断/预测纵向变化可能是一件坏事(即不一定如此,但可以如此)。 我已经从很多方面看到了这个错误:有人推断,由于英国的富人出行更多,所以随着社会的富裕起来,整个人口的出行也将增加。事实证明,这种推论在很长一段时间内都是不正确的-超过十年。这与家庭用电情况类似:横截面数据表明随着收入的增加而大量增加,这种增加不会随着时间的推移而显现。 有几件事发生,包括队列效应和供应方约束。 拥有一个参考文献来汇编这样的案例研究将非常有用;和/或使用概率论来说明为什么使用横截面数据来推断/预测纵向变化会产生非常非常的误导。 是否存在这样的论文,如果存在,那是什么?

4
是否对OLS中的遗漏变量偏差进行了测试?
我知道Ramsey重置测试可能会检测到非线性相关性。但是,如果只丢弃其中一个回归系数(仅是线性相关性),则可能会产生偏差,具体取决于相关性。重置测试显然未检测到这一点。 我没有找到针对这种情况的测试,而是这样声明:“除非包含潜在的省略变量,否则您无法测试OVB”。这可能是一个合理的陈述,不是吗?

2
工具与变量之间的因果关系方向是否重要?
关于因果关系(->)的工具变量的标准方案是: Z -> X -> Y 其中Z是工具,X是内生变量,Y是响应。 以下关系是否可能: Z <- X ->Y Z <-> X ->Y 也有效吗? 虽然满足了工具和变量之间的相关性,但在这种情况下我如何考虑排除限制? 注意:此符号<->不是明确的,可能导致对该问题的不同理解。答案仍然突出了这个问题,并用它来显示问题的重要方面。阅读时,请谨慎对待问题的这一部分。

4
有关因果推理的因果哲学的在线资源
您能推荐一些流行病学家/生物统计学家学习因果关系/因果推理原理的有趣且有用的书籍,文章,论文,在线教程/课程等吗? 我对从Epi和Biostats框架实际进行因果推理非常了解,但是我想了解一些基础知识并推动这项工作。例如,据我了解,休ume首先谈到了可以被解释为反事实的想法。 我基本上没有任何哲学方面的培训或经验,因此我需要相对入门的内容,但是我也对更复杂但重要/基础的文本/作者的建议感兴趣(但请指出它们不是入门性的)。 我希望对于交叉验证而言,这不是太题外话,但我希望你们中的某些人和我以前一样在同一条船上,并且能够共享自己喜欢的资源。

4
您如何找到数据中的因果关系?
可以说我有一个带有列“ A”,“ B”的表 是否有统计方法确定“ A”是否导致“ B”发生?一个人不能真正使用Pearson的r,因为: 它仅测试值之间的相关性 相关不是因果关系 皮尔森的r只能使线性关系相关 那么我在这里还有其他选择吗?

3
线性回归中的线性假设仅仅是的定义吗?
我正在修改线性回归。 格林的教科书指出: 现在,在线性回归模型上当然会有其他假设,例如。该假设与线性假设(实际上定义为)相结合,将结构置于模型上。E(ϵ|X)=0E(ϵ|X)=0E(\epsilon|X)=0ϵϵ\epsilon 但是,线性假设本身不会在我们的模型中添加任何结构,因为可以是完全任意的。对于任何变量,无论两者之间的关系如何,我们都可以定义一个使得线性假设成立。因此,线性“假设”的确可以称为一个定义的,而不是一个假设。ϵϵ\epsilonX,yX,yX, yϵϵ\epsilon εϵϵ\epsilon 因此我想知道: 格林草率吗?他实际上应该写出:吗?这是一个“线性假设”,实际上将结构放在模型上。E(y|X)=XβE(y|X)=XβE(y|X)=X\beta 还是我必须接受线性假设不将结构放在模型上而是仅定义一个,而其他假设将使用定义将结构放在模型上吗?εϵϵ\epsilonϵϵ\epsilon 编辑:由于其他假设似乎有些混乱,因此让我在此处添加全套假设: 这摘自Greene,《计量经济学分析》,第7版。p。16。

2
辛普森悖论是否涵盖了所有从隐藏变量撤消的情况?
以下是有关作为“辛普森悖论”存在的“图片证明”提供的许多可视化的问题,以及有关术语的问题。 辛普森悖论是一个相当简单的现象来描述,并给予的(原因数值例子,为什么会发生这种情况是深刻而有趣)。矛盾的是,存在2x2x2列联表(Agresti,分类数据分析),其中边际关联与每个条件关联的方向不同。 也就是说,两个亚群中比率的比较都可以朝一个方向进行,但合并总体中的比率可以朝另一个方向进行。在符号中: 存在使得 a + ba ,b ,c ,d,ē ,˚F,g ^,小时一个,b,C,d,Ë,F,G,Ha,b,c,d,e,f,g,h一个+ bc + d&gt; e + fG+ 小时一个+bC+d&gt;Ë+FG+H \frac{a+b}{c+d} > \frac{e+f}{g+h} 但 和一个C&lt; eG一个C&lt;ËG \frac{a}{c} < \frac{e}{g} bd&lt; fHbd&lt;FH \frac{b}{d} < \frac{f}{h} 在以下可视化中(从Wikipedia)可以准确地表示出这一点: 一小部分是简单地对应的矢量的斜率,并且很容易在该示例中看到,较短乙矢量具有比相应的L矢量更大的斜率,但合并乙向量具有较小比组合1载体斜率。 有许多形式的非常常见的可视化,特别是在Simpson上的Wikipedia参考文献的开头: 这是混淆的一个很好的例子,隐藏变量(将两个子种群分开)如何显示不同的模式。 但是,从数学上讲,这样的图像绝不对应于作为基于辛普森悖论现象的现象的列联表的显示。首先,回归线位于实值点集数据之上,而不是对列联表中的数据进行计数。 同样,可以在回归线上创建具有任意斜率关系的数据集,但是在列联表中,斜率的不同程度受到限制。也就是说,总体的回归线可以与给定子群体的所有回归正交。但是,在辛普森悖论中,尽管不是反向回归,但亚群的比率即使偏离另一个方向,也不会偏离合并的人群(同样,请参见维基百科的比率比较图)。 对我来说,每次我将后者视为辛普森悖论的形象时,都足以吓一跳。但是,由于我到处都看到(我称之为错误的)示例,所以我很想知道: 我是否错过了从原始的Simpson / Yule列联表示例到转化为回归线可视化的真实值的微妙转换? 当然,辛普森的错误是一个特殊的例子。已经术语“辛普森悖论”现在已经成为等同于与混杂的错误,所以,无论数学,任何通过隐变量的方向变革,可以称之为辛普森悖论? 附录:以下是对2xmxn(或2乘以m,连续的)表的一般化示例: 如果以投篮方式合并,则防守者越近,球员的投篮机会就越多。按投篮类型分组(实际上是与篮筐的距离),则发生的直观情况越多,则投篮越多,防守队员越远。 我认为此图像是辛普森(Simpson's)对更连续情况(防御者的距离)的概括。但是我仍然看不到回归线示例是Simpson的示例。

1
使用openMx在相同和异卵双胞胎的SEM概念模型中选择路径权重
我正在审查R包OpenMx进行遗传流行病学分析,以了解如何指定和拟合SEM模型。我对此很陌生,所以请多多包涵。我正在遵循《OpenMx用户指南》第59页上的示例。他们在这里绘制以下概念模型: 在指定路径时,他们将潜在的“一个”节点对显示的bmi节点“ T1”和“ T2”的权重设置为0.6,因为: 感兴趣的主要路径是从每个潜在变量到相应观察变量的路径。还估算了这些值(因此将它们全部设置为空),获得的起始值为0.6,并带有适当的标签。 # path coefficients for twin 1 mxPath( from=c("A1","C1","E1"), to="bmi1", arrows=1, free=TRUE, values=0.6, label=c("a","c","e") ), # path coefficients for twin 2 mxPath( from=c("A2","C2","E2"), to="bmi2", arrows=1, free=TRUE, values=0.6, label=c("a","c","e") ), 的0.6的值来自的估计的协方差bmi1和bmi2(严格的单合子双胞胎)。我有两个问题: 当他们说路径的“开始”值为0.6时,是否像在估计GLM时那样设置具有初始值的数值积分例程? 为什么严格根据单卵双胞胎估算这个值?

2
因果推论和预测之间有什么关系?
因果推论和预测(分类和回归)之间的关系和区别是什么? 在预测上下文中,我们具有预测器/输入变量和响应/输出变量。这是否意味着输入和输出变量之间存在因果关系?那么,预测是否属于因果推理? 如果我理解正确,则因果推理会考虑在给定另一个随机变量的情况下估计一个随机变量的条件分布,并且经常使用图形模型来表示随机变量之间的条件独立性。因此,从这个意义上讲,因果推理不是预测,是吗?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.