当我运行一些示例时,除最后几位数字外,等级的Phoson相关性的rho和t检验的p值总是匹配的
那么,您一直在运行错误的示例!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
向量a
和b
具有良好的线性相关性,但远非完美的线性(Pearson)相关性。但是,它们具有完美的等级相关性。见-到斯皮尔曼的ρ,在这种情况下,最后一位数字是否b
为8.1、9、90或9000(请尝试!)并不重要,只有大于8时才重要。这就是相关等级所产生的差异。
相反,而a
和b
有完善的等级相关,他们的Pearson相关系数小于1,这表明皮尔逊相关不反映行列。
皮尔逊相关性反映线性函数,秩相关性仅反映单调函数。在正常数据的情况下,两者将非常相似,我怀疑这就是为什么您的数据在Spearman和Pearson之间显示出较大差异的原因。
作为一个实际的例子,请考虑以下内容;您想看看身高较高的人是否体重更大。是的,这是一个愚蠢的问题……但是只要假设这就是您所关心的。现在,体重不再随体重线性增加,因为高个子的人也比小个子的人宽。因此体重不是身高的线性函数。比您高10%的人(平均)比您重10%以上。这就是为什么body / mass索引在分母中使用立方体的原因。
因此,您将假定线性相关关系以不正确地反映身高/体重关系。相反,在这种情况下,等级相关对物理和生物学的烦人规律不敏感;它并不能反映出人们随着身高的增长是否线性地线性增长,而只是反映出更高的人(在一个尺度上排名更高)是否在体重(在另一个尺度上排名更高)。
一个更典型的示例可能是类似Likert的问卷调查排名,例如人们对某项事物的评价为“完美/良好/体面/中等/不良/糟糕”。在规模上,“完美”与“体面”的距离远不如“体面”与“不良” 的远,但是我们真的可以说两者之间的距离是相同的吗?线性相关不一定合适。排名相关性更自然。
为了更直接地解决您的问题:不,Pearson和Spearman相关性的p值不能以不同的方式计算。两者在概念和数值上都有很大的不同,但是如果检验统计量相等,则p值将相等。
在Pearson相关正态的假设的问题,看到这个。
更一般地说,其他人在参数与非参数相关(也请参阅此处)主题以及关于分布假设的意义上比我能更好地阐述。