如何比较两个皮尔逊相关系数的强度?


10

一位审阅者向我询问,是否可以将表格中显示的皮尔逊相关性(r值)相互比较,以便人们可以说一个比另一个“强”(而不仅仅是盯着实际的r值) 。

您将如何处理?我发现了这种方法

http://vassarstats.net/rdiff.html

但不确定是否适用。


2
您的两个相关性是根据同一观察样本计算得出的吗?
Dimitriy V. Masterov

诸如差异的置信区间之类的东西可能会起作用。您可以在某些分布假设或渐近正态近似下使用模拟。在大样本中,您可以使用引导程序。
Glen_b-恢复莫妮卡2014年

AFAIK从z分数得出CI,然后将r上CI的z转换回r。即使对于引导CI,也可能首先对其进行转换。
乔纳

Answers:


22

(我假设您正在谈论从样本获得的r。)

该网站上的测试在某种意义上适用于将r视为任何参数,其值在两个总体之间可能有所不同。如何为[R从任何其他措施有什么不同,如平均值,这你在比较,使用非常有信心牛逼 -测试?嗯,这是不同的,因为它限制在-1,1之间,它没有正确的分布,因此您需要在进行推断之前对Fisher进行变换(然后再进行变换,如果要例如获得CI的话)。测试得出的z分数确实具有进行推理的正确形式。这就是您要链接的测试正在做的。

因此,您要链接到的过程是一个推断过程,如果您可以从要抽样的总体中获得总体r,则可能会发生什么- 一个群体的r是否会高于另一个群体的r?他们是完全一样的吗?我们称这个后来的假设为H0。如果测试返回的p值较低,则意味着基于样本,您应该对两个r的差值的真实值为正好为0 的假设信心不足(因为这种数据很少会出现r的差恰好为0)。如果不是,则您没有数据可以放心地拒绝精确等于r的假设,这是因为它成立,和/或样本不足。请注意,我本可以就均值差异(使用t检验)或其他任何方法做同样的事情。

完全不同的问题是,两者之间的区别是否有意义。可悲的是,对此没有直接的答案,没有统计检验可以为您提供答案。也许r的真实值(人口值,而不是您观察到的值)在一组中为0.5,在另一组中为0.47。在这种情况下,其当量的统计假设(我们的H0)将是错误的。但这是有意义的区别吗?它取决于-解释的方差多出3%的数量有意义还是无意义?科恩(Cohen)给出了解释r(大概是r之间的差异)的粗略指南,但是只有在建议这些只是起点的情况下,才这样做。即使您进行了一些推断,您甚至都不知道确切的差异,例如,通过计算两个相关性之间的差异的CI。很可能,一系列可能的差异将与您的数据兼容。

比较安全的选择是计算您的r的置信区间,并可能计算CI 的置信区间,然后让读者决定。


4
我不知道你是否是老师,但是你应该。由于您的出色解释,即使对于具有统计学基础知识的人也很容易理解。
空袭
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.