Spearman或Pearson与李克特量表的相关性,可能会违反线性和均方差


9

我想在使用李克特量表的许多测量结果上进行相关性分析。从散点图来看,似乎已经违反了线性和均方差性的假设。

  • 鉴于似乎有一些关于序数级别分级近似间隔级别缩放的争论,我应该安全地使用Spearman的Rho而不是Pearson的r?
  • 如果我与Spearman的Rho一起使用,是否有可以引用的参考文献?

Answers:


13

此网站上的先前答案:

在此站点上已多次询问相关问题。查看

秤与物品:

根据我的经验,对李克特项目进行分析与李克特量表之间存在差异。李克特量表是多个项目的总和。在对多个项目求和后,李克特量表获得更多可能的值,结果量表的块度较小。这样的量表通常具有足够多的分数,许多研究人员准备将它们视为连续的。当然,有些人会认为这有点轻率,并且在心理学计量学中已经有很多关于如何最好地衡量心理和相关结构的文章。

社会科学的标准实践:

从我阅读心理学期刊文章的偶然观察中,使用皮尔森相关系数分析了多个项目李克特量表之间的大多数双变量关系。在这里,我正在考虑个性,智力,态度,幸福感等尺度。如果您具有这样的量表,则值得考虑将您的结果与以前的结果进行比较,在以前的结果中,Pearson可能是主要的选择。

比较方法:

将皮尔逊氏法和斯皮尔曼氏法(甚至还有肯德尔的tau法)进行比较是一个有趣的练习。但是,您仍然需要决定使用哪个统计量,这最终取决于您对双变量关联的定义。

异方差性

相关系数是两个变量之间线性关系的精确总结,即使在没有同方性的情况下(或者,鉴于两个变量都不是因变量,我们应该说双变量正态性)。

非线性度

如果您的两个变量之间存在非线性关系,这很有趣。但是,两个变量仍可以视为连续变量,因此,您仍然可以使用Pearson's。例如,年龄通常与其他变量(例如收入)具有倒U型关系,但是年龄仍然是连续变量。

我建议您生成一个散点图,并拟合一些平滑的拟合(例如样条曲线或LOESS),以探索任何非线性关系。如果关系确实是非线性的,则线性相关不是描述这种关系的最佳选择。然后,您可能想探索多项式或非线性回归。


1
+1用于强调李克特项目和李克特量表之间的区别。
ThomasH 2012年

2

您几乎应该肯定会选择Spearman的rho或Kendall的tau。通常,如果数据是非正态的,但方差相等,则可以使用Pearson的r,因为它不会产生很大的差异。如果方差显着不同,则需要非参数方法。

您可能会引用几乎所有入门级统计教科书来支持对Spearman's Rho的使用。

更新:如果违反了线性假设,那么您不应该在数据上使用Pearson相关系数,因为它假设是线性关系。Spearman的Rho不带线性也可以接受,并且意味着变量之间具有更一般的单调关系。如果要使用Pearson的相关系数,可以查看对数转换数据,因为这可以处理非线性。


-1

一件事很确定,就是关联通常需要线性关系。现在您说您的数据有点曲线,所以非线性回归似乎是左手的选择


6
我认为这根本不是“很确定”。只有皮尔逊相关性可以衡量线性;可以说,其他类型的相关性的要点是,他们对什么才是关系的完美状态有更宽松的想法。
尼克·考克斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.