为什么


11

有一个回归模型,其中且且,其相关系数为。Y=a+bXa=1.6b=0.4r=0.60302

如果随后将和切换,并且等式变为,其中和,则值为。XYX=c+dYc=0.4545d=0.9091r0.60302

我希望有人能解释为什么(d×b)0.5也是0.60302

Answers:



10

看一下查看相关系数的十三种方法-特别是3、4、5方法将是您最感兴趣的方法。


2
这可能应该是一个评论。请注意,该链接已失效。我已经更新了链接并提供了完整的引文。您能否详细说明或提供其他信息,以便即使链接再次失效也仍然很有价值?
gung-恢复莫妮卡

2
Rodgers&Nicewander文章在我们的网站stats.stackexchange.com/q/70969/22228上进行了总结。
ub

3

回想一下许多介绍性文字

Sxy=i=1n(xix¯)(yiy¯)

然后通过设置作为X我们有小号X X = Σ Ñ = 1X - ˉ X2和类似š ÿ Ŷ = Σ Ñ = 1ÿ - ˉ ý2yxSxx=i=1n(xix¯)2Syy=i=1n(yiy¯)2

相关系数y- on- x回归的斜率(您的b)和x- on- y回归的斜率(您的d)的公式通常为:ryxbxyd

(1)r=SxySxxSyy(2)β^y on x=SxySxx(3)β^x on y=SxySyy

然后将3 相乘可清楚地得出1 的平方:(2)(3)(1)

β^y on xβ^x on y=Sxy2SxxSyy=r2

或者,通常将2 3 中的分数的分子和分母除以nn - 1 ),以便根据样本或估计的方差和协方差来构造事物。例如,从1 ,估计的相关系数就是估计的协方差,由估计的标准偏差缩放:(1)(2)(3)n(n1)(1)

(4)r=Corr^(X,Y)=Cov^(X,Y)SD(X)^SD(Y)^(5)β^y on x=Cov^(X,Y)Var(X)^(6)β^x on y=Cov^(X,Y)Var(Y)^

然后,我们立即从乘以找到6 (5)(6)

β^y on xβ^x on y=Cov^(X,Y)2Var(X)^Var(Y)^=(Cov^(X,Y)SD(X)^SD(Y)^)2=r2

相反,我们可能需要重新排列以将协方差写为“按比例放大”的相关性:(4)

(7)Cov^(X,Y)=rSD(X)^SD(Y)^

然后通过用5 6 ,我们可以把回归系数为β Ŷ  上  X = [R ^ SDÝ (7)(5)(6)βX 上 Ŷ=- [R^SDXβ^y on x=rSD^(y)SD^(x)。将它们相乘也会产生r2,这是@Karl的解决方案。以这种方式编写斜率有助于解释如何将相关系数视为标准化回归斜率β^x on y=rSD^(x)SD^(y)r2


最后请注意,在您的情况下r=bd=β^y on xβ^x on y

yxxy

r=sgn(β^y on x)β^y on xβ^x on y

sgn+11


1
您可能会发现我的这个答案很有趣,即使它没有明确解决这里提出的问题。
Dilip Sarwate 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.