和之间有什么区别吗?


21

相关系数通常用大写书写,但有时不写。我想知道和之间是否真的有区别?能否意味着什么比一个相关系数别的吗?Rr2R2r


7
令我惊讶的是,这个问题被否决了-它是明确且明确的,涵盖了术语使用不一致的问题。更糟糕的是,由于它区分大小写,因此很难进行澄清!除了可以用于两个截然不同的事物这一事实之外,当我们考虑没有截距项的模型时,情况变得更加糟糕,当确定系数甚至与的平方不相等时。人们会发现该符号令人困惑也就不足为奇了。rR2R
银鱼

Answers:


18

关于这个问题的符号似乎有所不同。

R在多重相关的情况下使用,被称为“多重相关系数”。它是观察到的响应之间的相关性Y ÿ装配由模型。该 ÿ通常由几个预测变量预测 X ,例如 ÿ = β 0 + β 1 X 1 + β 2 X 2,其中的截距和斜率系数 β已经从数据中估计。注意 0Y^Y^XiY^=β^0+β^1X1+β^2X2β^i0R1

符号是在双变量情况下使用的“样本相关系数”-即有两个变量XY-通常表示样本中XY之间的相关性。您可以将此作为对更广泛总体中两个变量之间的相关性ρ的估计。要关联两个变量,不必确定哪个是预测变量,哪个是响应变量。的确,如果您发现YX之间的相关性,则它与XY之间的相关性相同,因为相关性是。注意-rXYXYρYXXY对称的当符号 ř使用这种方式,用 - [R < 0(负相关)如果两个变量具有线性减小的关系(作为一个上升时,其它趋于下降)。1r1rr<0

当两个变量Y进行简单线性回归时,表示法不一致。此装置识别一个变量,ÿ,作为响应变量,和其他的,X,作为预测变量,拟合模型Ŷ = β 0 + β 1 X。有些人还用符号[R指示之间的相关性Ÿÿ而另一些(与多元回归一致性)写入[RXYYXY^=β^0+β^1XrYY^R。注意,观察到的和拟合的响应之间的相关性必须大于或等于零。这是一个原因我不喜欢使用符号在这种情况下:之间的关系XŸ可能是负的,而之间的相关性ŸŸ为正(事实上,它只会是的模XY之间的相关性)都可以用符号r表示。我看过一些教科书和Wikipedia文章,在r的两种含义之间几乎可以互换,发现它不必要地造成混淆。我更喜欢使用符号RrXYYY^XYrrR对之间的相关性ÿ在单个和多重回归。YY^

在既简单又多个regresion的,那么只要有嵌合在模型截距来看,之间ÿÿ是简单地确定系数的平方根- [R 2RYY^R2(通常称为“方差的解释比例”或类似)。具体来说,在简单线性回归的情况下,则R2=r2,其中我为xY之间的相关性写,并且R 2可以表示回归的确定系数或之间的相关性平方rXYR2 ÿ。由于 - 1 [R 1 0 [R 1,这意味着, - [R = | r | 。因此,例如,如果你得到之间的相关性 X ÿ [R = - 0.7然后之间的相关性 ÿ和拟合 ÿ从简单线性回归 Ŷ = β 0 + β 1 XYY^1r10R1R=|r|XYr=0.7YY^Y=β^0+β^1X将为,而确定系数将为R 2 = 0.49,即响应的几乎一半变化将由您的模型解释。R=0.7R2=0.49

如果模型中未包含任何拦截项,则符号是不明确的。通常将其用作确定系数,但是通常以与通常不同的方式进行计算,因此在从统计软件中读取输出时请务必小心。然后,它不再与多重相关性R的平方相同,在双变量情况下也不等于r 2R2Rr2

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.