Answers:
关于这个问题的符号似乎有所不同。
在多重相关的情况下使用,被称为“多重相关系数”。它是观察到的响应之间的相关性和 ÿ装配由模型。该 ÿ通常由几个预测变量预测 X 我,例如 ÿ = β 0 + β 1 X 1 + β 2 X 2,其中的截距和斜率系数 β我已经从数据中估计。注意 0。
符号是在双变量情况下使用的“样本相关系数”-即有两个变量X和Y-通常表示样本中X和Y之间的相关性。您可以将此作为对更广泛总体中两个变量之间的相关性ρ的估计。要关联两个变量,不必确定哪个是预测变量,哪个是响应变量。的确,如果您发现Y和X之间的相关性,则它与X和Y之间的相关性相同,因为相关性是。注意-对称的当符号 ř使用这种方式,用 - [R < 0(负相关)如果两个变量具有线性减小的关系(作为一个上升时,其它趋于下降)。
当两个变量和Y进行简单线性回归时,表示法不一致。此装置识别一个变量,ÿ,作为响应变量,和其他的,X,作为预测变量,拟合模型Ŷ = β 0 + β 1 X。有些人还用符号[R指示之间的相关性Ÿ和ÿ而另一些(与多元回归一致性)写入[R。注意,观察到的和拟合的响应之间的相关性必须大于或等于零。这是一个原因我不喜欢使用符号在这种情况下:之间的关系X和Ÿ可能是负的,而之间的相关性Ÿ和Ÿ为正(事实上,它只会是的模X和Y之间的相关性)都可以用符号r表示。我看过一些教科书和Wikipedia文章,在r的两种含义之间几乎可以互换,发现它不必要地造成混淆。我更喜欢使用符号R对之间的相关性和ÿ在单个和多重回归。
在既简单又多个regresion的,那么只要有嵌合在模型截距来看,之间ÿ和ÿ是简单地确定系数的平方根- [R 2(通常称为“方差的解释比例”或类似)。具体来说,在简单线性回归的情况下,则,其中我为x和Y之间的相关性写,并且R 2可以表示回归的确定系数或之间的相关性平方和 ÿ。由于 - 1 ≤ [R ≤ 1和 0 ≤ [R ≤ 1,这意味着, - [R = | r | 。因此,例如,如果你得到之间的相关性 X和 ÿ的 [R = - 0.7然后之间的相关性 ÿ和拟合 ÿ从简单线性回归 Ŷ = β 0 + β 1 X将为,而确定系数将为R 2 = 0.49,即响应的几乎一半变化将由您的模型解释。
如果模型中未包含任何拦截项,则符号是不明确的。通常将其用作确定系数,但是通常以与通常不同的方式进行计算,因此在从统计软件中读取输出时请务必小心。然后,它不再与多重相关性R的平方相同,在双变量情况下也不等于r 2!