简单的线性回归是否暗示因果关系?


17

我知道关联并不意味着因果关系,而是关系的强度和方向。简单的线性回归是否暗示因果关系?还是为此需要推论(t检验等)统计检验?


3
“方向”是什么意思?您是否已阅读stats.stackexchange.com/search?q=causal类似问题的答案?最简洁的答案是不!
NRH

3
您的建议均未暗示因果关系(或方向)。
亨利

2
我认为OP表示正向与负向相关性的“方向”,而不是X和Y之间任何因果关系的方向
JMS

Answers:


19

快速的答案是,不。您可以轻松地提出无关的数据,这些数据在回归时将通过各种统计检验。下面是Wikipedia的旧图片(由于某种原因最近已将其删除),该图片已用于说明数据驱动的“因果关系”。

我们需要更多海盗为地球降温吗?

在此处输入图片说明

对于时间序列,有一个称为“格兰杰因果关系”的术语具有非常特殊的含义。

http://en.wikipedia.org/wiki/Granger_causality

除此之外,“因果关系”在情人眼中。


我的意思是正相关或负相关。谢谢您的回复,并链接到类似的问题。
user4572 2011年

1
那张照片中的X轴相当疯狂!(但很好的例子!)
Andy W

2
另一个.....孟加拉的奶酪,黄油和绵羊,与S&P500(R ^ 2 = 0.99)…… nerdsonwallstreet.typepad.com
my_weblog/

5
该图显然已经过时了。由于缺少可在亚丁湾
主要的还是

2
这些数据是在戈尔成为海盗之前。
bill_080 2011年

10

回归数学中没有明确指出因果关系的关系,因此,无需明确解释斜率(强度和方向)或p值(即如果观察到了与关系一样强或强的概率)。因果关系)。

话虽这么说,我想说回归确实具有比估计两个变量之间的相关性更强的内涵,即人们正在估计一种明确的方向关系。假设相关性是指Pearson的r,因为度量是对称,所以它通常没有明确的因果解释(即,您可以切换哪个变量为X和哪个变量为Y,并且仍然具有相同的度量)。同样,我怀疑这样的口语化“相关性并不意味着因果关系”是众所周知的,以至于陈述两个变量是相关的,即假设一个不是在做因果关系。

但是,回归分析中的估计效果不是对称的,因此,通过选择右侧和左侧的变量,可以做出与相关性不同的隐式陈述。我怀疑有人打算在使用回归的绝大多数情况下做出因果关系陈述(除了推理还是预测)。即使只是简单地陈述相关性,我也怀疑人们在心目中经常有一些隐含的因果推理目标。只要满足一些约束条件,相关性就可以暗示因果关系


7

相关性和回归都不能表示因果关系(如@ bill_080的答案所示),但由于@Andy W表示回归通常基于显式固定(即独立)变量和显式(即随机)因变量。这些名称不适用于相关性分析。

引用索卡尔和罗尔夫(Sokal and Rohlf),1969年,第1页。496

“回归分析中,我们打算描述变量Y对独立变量X ... 的依赖性,以支持有关X的变化可能引起Y的变化的假设。”

“相反,相反,我们主要关注的是两个变量是相互依存的还是变化的 -也就是说,它们是一起变化的。我们不会将一个变量表示为另一个变量的函数。”

Sokal,RR和FJ Rohlf,1969年。生物测定法。弗里曼公司


4

从语义的角度来看,另一个目标是为良好的预测模型建立证据,而不是证明因果关系。为回归模型的预测值建立证据的简单过程是将您的数据分为两部分,并使回归与数据的一部分匹配,而对数据的另一部分进行拟合,以检验其预测效果如何。

格兰杰因果关系的概念很有趣。


2

β^=Cov(x,y)Var(x)
α^=y¯β^x¯,

其中Var(。)和Cov(。)是根据样本(数据)得出的估算值。

因此,这些参数本身就是x和y之间的一些相关函数。特别是,β只是一个“归一化”的相关系数。因此,回归中没有比因果关系更隐含的因果关系。因果回归是计量经济学中的一种特殊技术,在该技术中,人们将不得不依靠例如工具变量来解决诸如混淆混淆任何特定回归模型的因果解释之类的现象。

我的观点是:可以使回归成为因果关系,但不是默认的因果关系。

有关更多信息,请参见以下视频:https : //www.youtube.com/watch?v=Sqy_b5OSiXw&list=PLwJRxp3blEvaxmHgI2iOzNP6KGLSyd4dz&index=55&t=0s

鲁宾本人的“鲁宾模型”:http : //www.stat.columbia.edu/~cook/qr33.pdf

关于因果关系的入门课程(尽管还没有回归): https //www.coursera.org/learn/crash-course-in-causality


好点。欢迎来到简历。
Neil G

0

我的理解(我是因果关系初学者)如下:

  • 如果您的协变量来自受控实验,并且您的实验很好地隔离了假设的因果因子,则线性回归意味着因果关系(请参见 随机对照实验中的线性回归和因果关系)。

  • E(ϵ|X)0E(ϵ|X)0E(ϵ|X)=0并不意味着我们可以。

E(ϵ|X)=0


2
E(ϵ|X)=0

有关详细讨论,请参见stats.stackexchange.com/questions/59588/…,并提出了一些要点。
mlstudent

E(ϵ|X)=0

y=α+βx+ϵyxyx

YN(μY,σY)X|YN(a+bY,σX)E(ϵ|X)=0

-6

回归假设因果关系。...如果由于对问题的物理/智力/科学分析而没有因果关系的依据,那么就没有因果分析的依据,也没有回归的依据。这就是为什么FDA和类似的政府机构总是宣称“这就是原因!”的原因。后来却收回了数年的损失和数十亿美元的损失。例如军团:咖啡,巧克力,咖啡因,培根,鸡蛋等。

更糟糕的是两个变量具有反馈回路。一个可能导致另一点。只是让其他人引起一个,以后。这在我的经济学领域总是会发生:这就是为什么大多数经济分析都不值得在上面进行印刷的论文。


6
这是完全错误的。回归只是找到两组数字之间的关系。这种关系是否由于直接的因果关系而存在是完全不同的问题。
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.