当且仅当它们的等级相关时,随机变量才相关吗?


20

假设是具有有限第二矩的连续随机变量。Spearman秩相关系数ρ_s的总体版本可以定义为概率积分变换F_X(X)F_Y(Y)的皮尔逊积矩系数ρ ,其中F_X,F_YXY的cdf 。ρ小号˚F XX ˚F ÝÝ ˚F X˚F ÿ X ÿX,YρsFX(X)FY(Y)FX,FYXÿ

ρs(X,Y)=ρ(F(X),F(Y)

我想知道是否可以普遍得出这样的结论:

ρXÿ0ρFXFÿ0

即,当且仅当秩之间具有线性相关性时,我们才具有线性相关性吗?

更新:在评论中给出了两个例子,为什么

ρFXXFÿÿ=0ρXÿ=0

即使Xÿ具有相同的分布,通常也不是正确的。所以这个问题应该改写为

ρXÿ=0ρFXXFÿÿ吗?

如果Xÿ具有相同的分布,那么这是否为真对我也很感兴趣。

(注意:如果Xÿ与正象限相关,即δXÿ=FXÿXÿ-FXXFÿÿ>0则霍夫丁的协方差公式CØvXÿ=δXÿdXdÿ得出ρXÿ>0ρFXFÿ>0


4
提示:要获得答案,请考虑在任意严格单调变换下每种相关度量会发生什么。
主教

1
@cardinal:好吧,在严格单调变换下,斯皮尔曼的rho是不变的,经典的线性相关系数会发生变化,但是其不清楚如何(?)...尤其是我不知道线性相关值是否可以将其值从零更改为严格单调变换下的非零...但也许我错过了你的观点?
FSpanhel 2012年

您在正确的轨道上!令和。现在,看看这两个的严格单调变换。我没有明确检查过,但是可能有效。ÿ = X 2ż = EXP - Ž / 2 Xñ01个ÿ=X2Gž=经验值-ž/2
主教

2
没错 第二个示例不符合我的预期/预期。但是,如何构造这样的反例的一般原则仍然成立。而且,是的,这件事可以与copulas紧密地联系在一起。:-)
主教

2
确认反例之后,请考虑将其写在这篇文章的答案中。我很乐意支持它。干杯。
主教

Answers:


8

两个相关系数都不为零就可以告诉您另一个相关系数,因为它们“加权”数据(尤其是极端数据)有很大不同。我只是要处理样本,但是可以使用双变量分布/ copulas构造类似的例子。

1. Spearman相关性0并不暗示Pearson相关性0

正如问题中提到的,注释中有一些示例,但是基本结构是“构造一个Spearman相关性为0的情况,然后取一个极值点,使其更极端而无需更改Spearman相关性”

注释中的示例很好地涵盖了这一点,但是我将在这里使用一个更加“随机”的示例。因此,请考虑以下数据(以R计),该数据在构造上具有Spearman和Pearson相关系数均为0:

x=c(0.660527211673069, 0.853446087136149, -0.00673848667511427, 
-0.730570343152498, 0.0519171047989013, 0.00190761493801791, 
-0.72628058443299, 2.4453231076856, -0.918072410495674, -0.364060229489348, 
-0.520696233492491, 0.659907250608776)
y=c(-0.0214697990371976, 0.255615059485107, 1.10561181413232, 0.572216886959267, 
-0.929089680725018, 0.530329993414123, -0.219422799586819, -0.425186120279194, 
-0.848952532832652, 0.859700836483046, -0.00836246690850083, 
1.43806947831794)

cor(x,y);cor(x,y,method="sp")
[1] 1.523681e-18
[1] 0

现在,将y与[12]相加1000,然后从x [9]中减去0.6;Spearman相关性保持不变,但Pearson相关性现在为0.1841:

  ya=y
  ya[12]=ya[12]+1000
  xa=x
  xa[9]=xa[9]-.6
  cor(xa,ya);cor(xa,ya,method="sp")
[1] 0.1841168
[1] 0

(如果您想对Pearson相关性有很强的意义,只需将整个样本重复几次。)

2. Pearson相关性0并不暗示Spearman相关性0

这是两个皮尔逊相关性为零而斯皮尔曼相关性为非零的示例(同样,如果您想对这些斯皮尔曼相关性有很强的意义,只需复制整个样本几次)。

范例1:

 x1=c(rep(-3.4566679074320789866,20),-2:5)
 y1=x1*x1
 cor(x1,y1);cor(x1,y1,method="spe")
[1] -8.007297e-17 
[1] -0.3512699   

抛物线上的点排列为0皮尔逊,但非零Spearman相关性

范例2:

 k=16.881943016134132 
 x2=c(-9:9,-k,k)
 y2=c(-9:9,k,-k)
 cor(x2,y2);cor(x2,y2,method="spe")
[1] -9.154471e-17
[1] 0.4805195

除y = -x上的最小和最大点外,ay = x线上的点

在最后一个示例中,可以通过在y = x上添加更多点,同时使左上角和右下角的两个点更极端以使Pearson相关性保持为0,来增强Spearman相关性。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.