回想一下许多介绍性文字
Sxy=∑i=1n(xi−x¯)(yi−y¯)
然后通过设置作为X我们有小号X X = Σ Ñ 我= 1(X 我 - ˉ X)2和类似š ÿ Ŷ = Σ Ñ 我= 1(ÿ 我 - ˉ ý)2。yxSxx=∑ni=1(xi−x¯)2Syy=∑ni=1(yi−y¯)2
相关系数,y- on- x回归的斜率(您的b)和x- on- y回归的斜率(您的d)的公式通常为:ryxbxyd
rβ^y on xβ^x on y=SxySxxSyy−−−−−−√=SxySxx=SxySyy(1)(2)(3)
然后将和(3 )相乘可清楚地得出(1 )的平方:(2)(3)(1)
β^y on x⋅β^x on y=S2xySxxSyy=r2
或者,通常将,(2 )和(3 )中的分数的分子和分母除以n或(n - 1 ),以便根据样本或估计的方差和协方差来构造事物。例如,从(1 ),估计的相关系数就是估计的协方差,由估计的标准偏差缩放:(1)(2)(3)n(n−1)(1)
rβ^y on xβ^x on y=Corrˆ(X,Y)=Covˆ(X,Y)SD(X)ˆSD(Y)ˆ=Covˆ(X,Y)Var(X)ˆ=Covˆ(X,Y)Var(Y)ˆ(4)(5)(6)
然后,我们立即从乘以找到和(6 )该(5)(6)
β^y on xβ^x on y=Covˆ(X,Y)2Var(X)ˆVar(Y)ˆ=(Covˆ(X,Y)SD(X)ˆSD(Y)ˆ)2=r2
相反,我们可能需要重新排列以将协方差写为“按比例放大”的相关性:(4)
Covˆ(X,Y)=r⋅SD(X)ˆSD(Y)ˆ(7)
然后通过用到(5 )和(6 ),我们可以把回归系数为β Ŷ 上 X = [R ^ SD(Ý )(7)(5)(6)和βX 上 Ŷ=- [R^SD(X)β^y on x=rSDˆ(y)SDˆ(x)。将它们相乘也会产生r2,这是@Karl的解决方案。以这种方式编写斜率有助于解释如何将相关系数视为标准化回归斜率。β^x on y=rSDˆ(x)SDˆ(y)r2
最后请注意,在您的情况下r=bd−−√=β^y on xβ^x on y−−−−−−−−−−√
yxxy
r=sgn(β^y on x)β^y on xβ^x on y−−−−−−−−−−√
sgn+1−1