在哪种情况下,一个应该比另一个更喜欢?
我发现有人出于教学原因声称对肯德尔有优势,还有其他原因吗?
在哪种情况下,一个应该比另一个更喜欢?
我发现有人出于教学原因声称对肯德尔有优势,还有其他原因吗?
Answers:
我发现,在测量量表上使用整数值的分数,具有适中的可能分数或不想依赖双变量关系的假设时,Spearman相关性通常用于代替通常的线性相关性。与Pearson系数相比,在我看来,对Kendall的tau的解释比对Spearman的rho的解释不那么直接,因为它可以量化所有可能的成对事件之间一致对和不一致对的百分比之间的差异。在我的理解中,肯德尔的牛头更类似于古德曼·克鲁斯卡尔·伽玛(Goodman-Kruskal Gamma)。
我刚刚浏览了J. Statistics Educ中Larry Winner的文章。(2006年)讨论了这两种方法的使用,即1975-2003年NASCAR温斯顿杯比赛结果。
在这方面,我还发现@onestop有关皮尔逊或斯皮尔曼与非正常数据的相关性的答案很有趣。
值得注意的是,Kendall的tau(a版)与用于预测建模的Somers'D(和Harrell's C)有关(例如,参见RB Newson的四个简单模型下的Somers'D的解释及其中的参考文献6,以及Newson的文章)。出版于《 Stata Journal》 2006年)。《等级统计的折刀置信区间的有效计算》中提供了等级和检验的概述,该出版物发表在JSS(2006)中。
再次有点哲学上的回答;基本的区别在于,Spearman的Rho尝试将R ^ 2(“方差解释”)的概念扩展到非线性相互作用上,而Kendall的Tau则旨在作为非线性相关性测试的测试统计量。因此,应该使用Tau来测试非线性相关性,将Rho用作R扩展(或者对于熟悉R ^ 2的人-在有限的时间内向不知情的观众解释Tau会很痛苦)。
FWIW,引自Myers&Well(研究设计和统计分析,第二版,2003年,第510页)。如果您仍然在意p值;
赛格尔和城主(1988年,对于行为科学非参数统计)指出,尽管和斯皮尔曼一般会在同一个数据集,计算时当显着性检验有不同的价值观和斯皮尔曼基于它们的采样分布将产生相同的p值。