与相关系数之间的关系


39

比方说,我有两个一维数组,a1a2。每个包含100个数据点。a1是实际数据,a2是模型预测。在这种情况下,R2值为:

R2=1SSresSStot  (1).
同时,这将等于相关系数的平方值,
R2=(Correlation Coefficient)2(2).
现在,如果我交换两个:a2是实际的数据,和a1是模型预测。根据等式(2),由于相关系数无关紧要,因此R2值相同。然而,从等式(1)SStot=i(yiy¯)2时,R2值将改变,因为SStot如果我们切换已经改变ya1a2 ; 在此同时,SSres=i(fiy¯)2也不会改变。

我的问题是:这些如何相互矛盾?

编辑

  1. 我想知道,等式中的关系会否。(2)如果不是简单的线性回归,即IV和DV之间的关系不是线性的(可以是指数/对数),则仍然成立?

  2. 如果预测误差的总和不等于零,这种关系是否还会成立?


我发现此演示文稿非常有用且非技术性:google.com/…–
ihadanny

Answers:


19

会发生变化是正确的……但是您忘记了平方和的回归值也将发生变化的事实。因此,让我们考虑简单的回归模型,并将相关系数表示为r 2 x y = S 2 x ySStot,在这里我使用子索引xy来强调x是自变量而y是因变量的事实。显然,如果将xy交换,则r2 x y不变。我们可以很容易地证明SSRxy=SyyR2 x y,其中SSRxy是平方和的回归总和。 rxy2=Sxy2SxxSyyxyxyrxy2xySSRxy=Syy(Rxy2)SSRxy x的独立平方且 y是因变量的平方总和。因此: R 2 x y = S S R x ySyyxy其中SSExy是相应的平方余数,其中x是独立的,y是因变量。请注意,在这种情况下,我们有SSExy=b2 x y Sxxb=Sxy

Rxy2=SSRxySyy=SyySSExySyy,
SSExyxySSExy=bxy2Sxx(例如参见此处的方程(34)-(41)。)因此:R2 x y =Syy- S 2 x yb=SxySxx显然,以上方程相对于xy是对称的。换句话说:R2 x y =R2 y x总结当改变Xÿ在简单回归模型,的分子和分母- [R2 X Ŷ =小号小号- [RXÿ
Rxy2=SyySxy2Sxx2.SxxSyy=SyySxxSxy2Sxx.Syy.
xy
Rxy2=Ryx2.
xy将以R2 x y =R2 y x的方式变化Rxy2=SSRxySyyRxy2=Ryx2.

R2=r2

1
R2=SSreg/SStotSSres=i(fiy¯)2SStotR2被改变了。
肖恩·王

对于p变量高斯的一般情况,您碰巧有关于如何解决此问题的参考吗?
JMB


6

R2=r2=Corr(x,y)2

R2=Corr(yestimated,yobserved)2

响应和拟合线性模型之间的相关性平方。


5

rr2

rYXXYr.30

r2r2=(covσxσy)2=|cov|σx2|cov|σy2r2proppropr

covσx2σy2covcovσx2σy2σxσyr2r

rr2Y~XX~Y


R2R2R2

确定系数或R平方比r ^ 2宽泛,这仅与简单线性回归有关。请阅读Wikipedia en.wikipedia.org/wiki/Coefficient_of_determination
ttnphns 2014年

再次感谢!我确实知道。我的问题是:对于更复杂的回归,我是否仍可以对r值求平方以获得确定系数?
肖恩·王

1
对于“复杂回归”,您得到R平方,但没有得到r。
ttnphns 2014年

1

R2=r2R2

x=rnorm(1000); y=rnorm(1000)              # store random data
summary(lm(y~x))                          # fit a linear regression model (a)
summary(lm(x~y))                          # swap variables and fit the opposite model (b)
z=lm(y~x)$fitted.values; summary(lm(y~z)) # substitute predictions for IV in model (a)

R2R2

R2r2R2rρ


1
R2=0.1468SSR>SSTR2R2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.