您如何找到数据中的因果关系?


11

可以说我有一个带有列“ A”,“ B”的表

是否有统计方法确定“ A”是否导致“ B”发生?一个人不能真正使用Pearson的r,因为:

  • 它仅测试值之间的相关性
  • 相关不是因果关系
  • 皮尔森的r只能使线性关系相关

那么我在这里还有其他选择吗?


1
那没有。从这些数据可以证明高度相关;您无法证明因果关系。


1
因果关系不是您可以从数字中榨取的东西……所以,在我后面重复:因果关系不相关因果关系不 ……
JM不是统计学家

1
参见Judea Pearl的“因果关系”(2011年图灵奖获得者)。

Answers:


4

到目前为止,答案和评论在实践上基本上是正确的,但是为了完整起见,已经对基于贝叶斯统计和图论的所谓因果关系模型进行了研究。因此,尽管总的来说,相关性确实并不意味着因果关系,但还有一些更复杂的模型试图找出因果关系。有关更多详细信息,请参见Judea Pearl 撰写的《因果关系》一书,但这是非常繁琐的数学,可能不是您想要的。


2

有许多所谓的准实验方法,即使您的数据是观察性的,您也可以用它们可靠地论证因果关系。这些方法通常依赖于在您感兴趣的变量中找到外源变异的来源。

我认为“最无害的计量经济学”一书给出了一个很好且易于访问的概述。它们基本上涵盖了人们(至少在某些时候)相信的所有准实验方法。它们没有涵盖trb456所提到的方法(出于相同的原因:没有多少人相信它们)。


1

要确定因果关系,您需要执行随机化测试。您参加了测试科目,并随机选择其中一半获得A质量,另一半选择不具有A质量。然后,您可以查看两组之间质量B的统计差异是否显着。

在进行任何测量之前,先进行随机化很重要。尤其是,如果为您提供了已测量和的数据集,则无法确定因果关系。AB

请注意,可能无法进行所需的随机化测试。例如,您如何测试身高过高会导致您体重增加?当然,身高和体重之间存在相关性,但是您不能将一组人随机分配给“高”组,将一个人随机分配给“矮”组。在这种情况下,无法进行随机测试。


0

Somers的工作以梨森相关系数对数据集所做的方式来解释序数变量之间的关系。


1
我同意,建立因果关系不仅需要数字。如何使用序数变量成为问题?
Michael R. Chernick

1
@MichaelChernick Somers的D是协会的一种不对称度量。它可以区分之间的“如果下雨,则是阴天,”从‘如果是阴天,则下雨’它为序或更高的数据它没有建立因果关系,但它建立的方向性。
戴夫·哈里斯(Dave Harris)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.