当Spearman相关性比Pearson小一定数量时,它表示什么?


12

我有一堆相关的数据集。它们之间成对的皮尔逊相关性通常肯定比斯皮尔曼相关性大。这表明任何相关都是线性的,但是即使皮尔逊和斯皮尔曼是相同的,也可能期望这样。当皮尔逊和斯皮尔曼相关性之间存在一定的差距并且皮尔逊更大时,这意味着什么?这似乎是我所有数据集的一致特征。


非常相似的问题,这里给出
Colin T Bowers,2015年

Answers:


14

Spearman相关只是使用等级(顺序统计)而不是实际数值的Pearson相关。您问题的答案是他们没有衡量同一件事。皮尔逊:线性趋势,斯皮尔曼:单调趋势。皮尔逊相关性较高意味着线性相关性大于秩相关性。这可能是由于分布尾部的影响性观察相对于其排名值具有很大的影响。当数据中保持线性时,使用Pearson相关性进行的关联测试具有更高的功效。


1
我知道,长矛军只是行列中的子弹头。我需要查看是否还有其他路线也可能导致这种情况,但是有影响力的尾部观察比数据的线性关系更紧密,但是如果被排名取代后失去影响,那么肯定会导致我看到。
约翰·罗伯逊

0

皮尔森相关性为准确起见假设了几个假设:1)每个变量都是正态分布的;2)同方性,每个变量的方差保持恒定;3)线性,这意味着描述关系的散点图显示数据点围绕回归线对称聚集。

Spearman相关性是基于观测等级的Pearson非参数替代方法。Spearman相关性使您可以放宽关于数据集的所有三个假设,并得出仍相当准确的相关性。

您的数据所暗示的是,它可能会实质性地破坏一个或多个上述假设,从而使两个相关性显着不同。

鉴于您在两个相关性之间有很大的差距,您应该研究数据集的变量在散点图中是否呈正态分布,同线性和线性。

上述调查将帮助您确定Spearman或Pearson相关系数是否更具代表性。


2
您可能正在考虑使用而不是描述性度量来进行关联的推理测试。但是,该测试通常被描述为具有与您陈述的假设不同的假设。例如,双变量正态性比单个正态分布的假设更强。请提供您的陈述的参考。Ť
caracal 2012年

4
不正确 皮尔逊相关性的推论不需要任何这些假设即可成立。一个人可能与异方差非正态数据具有曲线关系,而皮尔逊相关性检验(相当于线性回归模型的推论)可以检测一阶趋势。皮尔逊相关性作为一阶趋势强度的解释仍然成立。在极少数情况下,通过皮尔森相关性测得的一阶趋势不足以进行分析。
AdamO 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.