Goodman-Kruskal伽玛和Kendall tau或Spearman rho相关性如何比较?


31

在我的工作中,我们正在比较某些数据集的预测排名与真实排名。直到最近,我们一直单独使用Kendall-Tau。一个从事类似项目的小组建议我们尝试改用Goodman-Kruskal Gamma,他们更喜欢它。我想知道不同等级相关算法之间的区别是什么。

我找到的最好的答案就是该答案,它声称使用Spearman代替了通常的线性相关,并且Kendall-Tau不太直接,更类似于Goodman-Kruskal Gamma。我正在使用的数据似乎没有任何明显的线性相关性,并且数据严重偏斜且非正态。

而且,对于我们的数据,Spearman通常报告的关联性高于Kendall-Tau,我想知道关于数据的具体含义。我不是统计学家,所以抱歉,我正在阅读的某些论文对我而言像是行话。


3
对于我们的数据,Spearman通常报告的关联性比Kendall-Tau好,我想知道关于数据的具体说明是 ……...可能什么也没有;肯德尔τ经常接近0比斯皮尔曼ρ时的相关性是不是真的接近0±1 -它不同的测量关联; 通常幅度较小的事实并不意味着Spearman相关性“更好”;他们只是在衡量数据的不同之处。什么会导致您说“更好的相关性”?
Glen_b-恢复莫妮卡

1
这与我的问题@Glen_b间接相同;除此之外,我在问为什么算法报告了更高的相关性以及什么原因。我将“更好”更改为“更高”,以便使我的意思更清楚。您是对的,他们衡量的是不同的事物,数字之间确实没有太多的联系,但是我想知道数字的实际含义,下面将对此进行详细解答。
Poik

Answers:


29

Spearman Rho对Kendall tau。两者在计算上有很大差异,您无法直接比较它们的大小。Spearman通常会高出1/4到1/3,这使人错误地得出结论:Spearman对于特定数据集“更好”。rho和tau之间的区别在于意识形态,rho 的差异比例和tau的概率。Rho是用于排序数据的常用Pearson r,并且像r一样,对大弯矩(即距云中心的偏离)的点比对小弯矩的点更敏感。因此,Rho对排名后的云的形状非常敏感完成:椭圆形菱形云的系数将高于椭圆形哑铃云的系数(因为前者的尖锐边缘是较大的力矩)。Tau是Gamma的扩展,对所有数据点同样敏感,因此对排名云形状的特殊性不太敏感。Tau比rho更“一般”,因为rho仅在您相信变量之间的基础(模型或人口函数)关系严格单调时才被保证。尽管Tau允许非单调的潜在曲线,并且可以衡量总体上哪个单调的“趋势”(正的或负的)普遍存在。Rho的大小可与r相媲美;头不是。

Kendall tau饰演Gamma。Tau只是Gamma的标准形式。几个相关的度量都有分子但是归一化分母不同:PQ

  • 伽马:P+Q
  • Somers的D(“ x依赖”):P+Q+Tx
  • Somers的D(“取决于y”):P+Q+Ty
  • Somers'D(“ symmetric”):以上两个的算术平均值
  • 肯德尔的Tau-b corr。(最适合方桌):这两个的几何平均值
  • 肯德尔的Tau-c corr。(最适合矩形桌):N2(k1)/(2k)
  • 肯德尔的Tau-a corr。(对领带进行n®调整):N(N1)/2=P+Q+Tx+Ty+Txy

其中具有“一致性”的观测对数,Q-具有“反演” 的观测对;T x-变量X的联系数量,T y-变量Y的收入,T x y-两个变量的联系;N-观察数,k-该变量中不重复值的数目,此数目较小。PQTxTyTxyNk

因此,tau的理论和强度可直接与Gamma媲美。Rho在理论上和强度上与Pearson 直接可比。尼克·斯汤纳(Nick Stauner)的一个很好的答案告诉我们如何间接比较rho和tau。r

另请参见有关tau和rho。


14

这是安德鲁·吉尔潘(Andrew Gilpin,1993)的一句话,它出于理论上的原因而主张莫里斯·肯德尔(Maurice Kendall)的优于斯皮尔曼的ρτρ

随着样本大小N的增加,[肯德尔的 ]比ρ更快地接近正态分布。并且τ在数学上也更易于处理,尤其是在存在联系的情况下。 τρNτ

我不能多增加约古德曼-克鲁斯卡尔,比它似乎产生不断所谓稍微大一点的估计比Kendall的其他τ调查数据的样本我最近一直工作在...,当然,显着比Spearman的ρ低。但是,我还尝试计算了几个局部γ估计(Foraita&Sobotka,2012年),得出的结果比局部τ更接近局部ρ ...虽然花费了相当多的处理时间,所以我将离开模拟测试或与其他人的数学比较...(谁会知道如何做...)γτργρτ

正如ttnphns所暗示的那样,仅凭幅度而言,您不能得出估计值优于τ估计值的结论,因为它们的标度不同(即使限制没有差别)。Gilpin引用肯德尔(Kendall,1962)的描述,在大多数值范围内,ρτ之比约为1.5。随着幅度的增加,它们逐渐接近,因此,当两者都接近1(或-1)时,差异就变得很小。吉尔平给出了一个漂亮的大表,等效于ρrr 2dZ rτ的第三位数ρτρτρrr2Zrτ在其范围内以.01的每一个增量递增,就像您希望看到Intro Stats教科书的封面一样。他根据Kendall的特定公式,这是那些价值如下: (我从吉尔平(Pillson'sr)的形式简化了ρ的这个公式)

r=sin(τπ2)ρ=6π(τarcsin(sin(τπ2)2))
ρr

将您的转换为ρτρ并查看计算变化如何影响您的效应量估计值也许是有意义的。似乎可以通过比较来表明Spearman的对您的数据更敏感的问题(如果有的话)的程度。当然,可以使用更直接的方法来分别识别每个特定问题。我的建议将为这些问题产生更多的快速而综合的效果。如果没有差异(在校正了尺度差异之后),则有人可能会认为没有必要进一步寻找仅适用于ρ的问题。ρρ。如果存在实质性差异,那么可能是时候打破放大镜来确定是什么原因了。

我不确定人们在使用Kendall的时通常如何报告效果大小(不幸的是,人们通常担心报告效果大小),但是由于不熟悉的读者似乎会尝试按照Pearson's的尺度来解释效果大小[R ,它可能是明智的,同时报告你的τ统计和规模其作用大小[R出规模不同,与通过上述转换公式......或至少点,并给予喊出来吉尔平对他方便的转换表。τrτr

参考文献

Foraita,R.和Sobotka,F.(2012年)。图形模型的验证。 gmvalid软件包,v1.23。 全面的R存档网络。网址:http//cran.r-project.org/web/packages/gmvalid/gmvalid.pdf

吉尔平,AR(1993)。在荟萃分析的效果量度范围内将肯德尔的Tau转换为Spearman的Rho的表格。 教育与心理测量,53(1),87-92。

肯德尔(MG)(1962)。 等级相关方法(第3版)。伦敦:格里芬。


9

这些都是单调关联的良好指标。Spearman的与观察的随机三元组中多数一致的概率有关,而τ(Kendall)和γ(Goodman-Kruskal)与成对一致有关。主要的决定,使在选择γτ是你是否想惩罚为纽带X和/或ÿγ都不会对两者产生不利影响,因此比较X 1X 2预测Y的预测能力不会奖励X之一ρτγγτXYγX1X2YX表示更连续。缺乏奖励使得它与基于模型的似然比测试有点不一致。紧密联系在一起的(例如二进制X)可以具有较高的γXXγ


2
弗兰克(Frank),如果可以的话,您能Spearman's ρ is related to the probability of majority concordance among random triplets of observations在数学上说得更详细些吗?谢谢。
ttnphns 2013年

1
我读了很多年前,可能是在非参数统计文本中阅读的。我一直找不到参考。
弗兰克·哈雷尔

1
不幸的... :-(因为语句本身是非常耐人寻味。
ttnphns
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.