如何理解相关系数公式?


15

谁能帮助我了解Pearson相关公式?样本 =变量和的标准分数的乘积平均值。rXY

我有点理解为什么他们需要对和进行标准化,但是如何理解z得分的乘积呢? XY

该公式也称为“产品-时刻相关系数”,但是产品作用的原理是什么?我不确定是否已经明确说明了我的问题,但是我只想直观地记住该公式。


11
您可能需要阅读论文“查看相关系数的十三种方法”(Rodgers和Nicewander 1988)。如标题所示,它讨论了相关系数的十三种不同的直观视图。因此,希望至少有人会点击:)
半步


4
了解相关性(根据z分数的乘积)的第14种方法归结为了解标准化变量的协方差,如stats.stackexchange.com/questions/18058/…所示
ub

4
...第15种方法使用stats.stackexchange.com/a/46508/919中显示的:最小二乘拟合使圆的总面积最小化(当点做完时,至少有两种方法可以这样做)而不是精确排列),则相关系数就是它们的平均面积(当两个变量都标准化时)。
ub

Answers:


14

在评论中,提出了15种理解相关系数的方法:


Rodgers和Nicewander文章(美国统计师,1988年2月)中讨论的13种方式是

  1. 原始分数和均值的功能,

    r=(XiX¯)(YiY¯)(XiX¯)2(YiY¯)2.
  2. 标准化协方差

    r=sXY/(sXsY)

    其中是样本协方差,而s Xs Y是样本标准差。sXYsXsY

  3. 回归线的标准坡度

    r=bYXsXsY=bXYsYsX,

    其中b X ý是回归线的斜率。bYXbXY

  4. 两个回归斜率的几何平均值,

    r=±bYXbXY.
  5. 两个方差之比的平方根(占变异性的比例),

    r=(YiYi^)2(YiY¯)2=SSREGSSTOT=sY^sY.
  6. 标准变量的平均叉积,

    r=zXzY/N.
  7. 两条标准回归线之间的夹角函数。两条回归线(XXY)关于对角线对称。令两条线之间的角度为β。然后YXXYβ

    r=sec(β)±tan(β).
  8. 两个变量向量之间的夹角函数

    r=cos(α).
  9. 标准化分数之间差异的重新定标方差。为每个观测值的标准化XY变量之间的差,zYzXXY

    r=1s(zYzX)2/2=s(zY+zX)2/21.
  10. 根据“气球”规则估算,

    r1(h/H)2

    其中,是整个X - Y散点图的垂直范围,h是通过“ X轴上的分布中心”(即通过均值点)的范围。HXYhX

  11. 关于等浓度的双变量椭圆,

    r=D2d2D2+d2

    其中d分别是长轴和短轴长度。 r也等于等高线与垂直轴的交点处的等高线切线的斜率(在标准坐标下)。Ddr

  12. 设计实验的测试统计功能,

    r=tt2+n2

    其中是检验统计量在两独立样本要设计的实验测试具有两个处理条件(编码为X = 0 1)和Ñ是在两个治疗组观测的组合总数。ttX=0,1n

  13. 两种均值之比。假设双变量正态性并标准化变量。选择一些任意大的值X。然后XcX

    r=E(Y|X>Xc)E(X|X>Xc).

(其中大部分是逐字记录的,在某些表示法中有很小的变化。)

其他一些方法(也许是本网站独创的)是

  • r

  • r


2
谢谢@Avraham,感谢您尝试通过在此处发布答案来使此未答复的话题变得封闭。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.