Kendall Tau还是Spearman的rho?


69

在哪种情况下,一个应该比另一个更喜欢?

我发现有人出于教学原因声称对肯德尔有优势,还有其他原因吗?


另请参阅相关问题stats.stackexchange.com/q/18112/3277
ttnphns

1
不幸的是,您问题中的链接已失效。我假设您是指Noether(2007年,教学统计。您要编辑吗?
Stephan Kolassa '16

Answers:


40

我发现,在测量量表上使用整数值的分数,具有适中的可能分数或不想依赖双变量关系的假设时,Spearman相关性通常用于代替通常的线性相关性。与Pearson系数相比,在我看来,对Kendall的tau的解释比对Spearman的rho的解释不那么直接,因为它可以量化所有可能的成对事件之间一致对和不一致对的百分比之间的差异。在我的理解中,肯德尔的牛头更类似于古德曼·克鲁斯卡尔·伽玛(Goodman-Kruskal Gamma)

我刚刚浏览了J. Statistics Educ中Larry Winner的文章。(2006年)讨论了这两种方法的使用,即1975-2003年NASCAR温斯顿杯比赛结果

在这方面,我还发现@onestop有关皮尔逊或斯皮尔曼与非正常数据的相关性的答案很有趣。

值得注意的是,Kendall的tau(a版)与用于预测建模的Somers'D(和Harrell's C)有关(例如,参见RB Newson的四个简单模型下的Somers'D的解释及其中的参考文献6,以及Newson的文章)。出版于《 Stata Journal》 2006年)。《等级统计的折刀置信区间的有效计算》中提供了等级和检验的概述,该出版物发表在JSS(2006)中。


感谢chl的回答,我接受它的范围很广。最好,塔尔
塔尔加利里

Spearman经常使用两个整数变量对领带进行校正,这似乎由Kendall的tau处理得更好。
vinnief '16

29

我请这位绅士回答我以前的回答:“…… 与Spendman的τ参数的置信区间相比,Spearman的r S的置信区间不那么可靠,也难以解释”,根据Kendall&Gibbons(1990)的观点。


1
我想感谢Roger Newson,因为我只是引用他的文章。
一站式

22

再次有点哲学上的回答;基本的区别在于,Spearman的Rho尝试将R ^ 2(“方差解释”)的概念扩展到非线性相互作用上,而Kendall的Tau则旨在作为非线性相关性测试的测试统计量。因此,应该使用Tau来测试非线性相关性,将Rho用作R扩展(或者对于熟悉R ^ 2的人-在有限的时间内向不知情的观众解释Tau会很痛苦)。


6
你能解释一下“非线性相互作用”吗?Spearman Rho似乎反映了从心理学角度衡量效度系数的方法。我不知道Tau的性质。
Subhash C. Davar

我不理解您的评论的心理测验。
莱奥波德·赫兹(LéoLéopoldHertz)2016年

1
之所以称为“非线性相互作用”,是因为重要的是排序,而不是线性相关。例如,和具有0的Pearson相关而Kendall的tau或Spearman的RHO将具有得分1x 2xx2
勒芒奥巴迪亚

1
仅当x为非负数时才如此。
aocall

17

这是安德鲁·吉尔平(Andrew Gilpin,1993)的一句名言,出于理论原因,他主张肯德尔的τ优于斯皮尔曼的ρ

“ [肯德尔的 ]比更快地接近正态分布,因为样本数量增加;并且在数学上也更易于处理,尤其是在存在联系的情况下。” τρNτ

参考

吉尔平,AR(1993)。在荟萃分析的效果量度范围内将肯德尔的Tau转换为Spearman的Rho的表格。 教育与心理测量,53(1),87-92。


3

FWIW,引自Myers&Well(研究设计和统计分析,第二版,2003年,第510页)。如果您仍然在意p值;

赛格尔和城主(1988年,对于行为科学非参数统计)指出,尽管和斯皮尔曼一般会在同一个数据集,计算时当显着性检验有不同的价值观和斯皮尔曼基于它们的采样分布将产生相同的p值τρτρ


您知道他们是否对此主张提供任何支持吗?我不知道它在一般情况下是如何正确的(它们通常经常是相似的,但我真的不明白它们将是相同的断言如何能够成立)。[我想知道Siegel和Castellan是否真的说了这
句话

我检查了Siegel&Castellan(2ed p253)。他们说的话确实有些不同……但是实际上比上面的解释还差一点,即使加上了“大约”(更糟糕的是,因为它们限制为null下的情况,但因为它们是基于数据的条件那也不会帮助。无论如何,对于一个固定的顺序,所有可能的顺位同样H0下可能的。),他们认为空调的空上的数据事务调理后是困扰的事实。我想知道他们是要说别的话还是真的误会了?xy
Glen_b '16

作为反例,取n = 7和精确的p值。令x = 1,2,3,4,5,6,7且y = 2,1,4,3,7,6,5 ... spearman给出p = 0.048,Kendall给出0.136 ...一点也不一样。不同的排列方式给kendall的值相同,但spearman的p = 0.302。这样的例子很多,样本量也很多
Glen_b '16

3
这是n = 8情况的图。如您所见,两种相关度量的p值之间存在很大差异:i.stack.imgur.com/5JMbj.png ...我可能会对此进行
答问

1
这是两个示例数据集(排名之后),显示了两种情况(这次n = 9),其中Spearman相关p值相同,但Kendall相关p值却大不相同:i.stack.imgur。 com / 3ILD8.png
Glen_b
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.