可以仅根据相关系数和样本数量来计算Pearson相关检验的p值吗?


12

背景:我读过一篇文章,作者从878样本中报告了Pearson相关系数0.754。相关检验的p值显着为“两颗星”(即p <0.01)。但是,我认为在如此大的样本量下,相应的p值应小于0.001(即三颗星)。

  • 可以仅根据皮尔逊相关系数和样本量来计算该检验的p值吗?
  • 如果是,该如何在R中完成?

1
对于那些感兴趣的人,这里有一个在线r值计算器,取r和n
Jeromy Anglim 2013年

Answers:


14

是的,如果您使用Fisher的R到z转换,则可以完成。其他方法(例如引导程序)可以具有一些优点,但是需要原始数据。在R中(r是样本相关系数,n是观察数):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

另请参阅我的博客上的这篇文章

就是说,无论是.01还是.001都没关系。如您所说,这主要是样本量的函数,并且您已经知道样本量很大。合理的结论是,您甚至可能根本不需要测试(尤其是不需要对相关性为0的所谓“零”假设进行测试)。在N = 878的情况下,您可以对估计的精度非常有信心,并专注于直接对其进行解释(即,您所在领域的.75大吗?)。

但是,正式地,当您在Neyman-Pearson框架中进行统计检验时,需要预先指定错误级别。因此,如果测试的结果确实很重要,并且计划以.01作为阈值进行研究,则仅报告p <.01 是有意义的,并且您不应根据获得的p值将其设为p <.001 。这种类型的未公开的灵活性甚至是批评小星星的主要原因之一,更普遍地是社会科学中进行零假设重要性检验的方式。

参见Meehl,PE(1978)。理论风险和表格星号:卡尔爵士,罗纳德爵士,以及软心理学进展缓慢。咨询与临床心理学杂志, 46(4),806-834。(标题包含对这些“星星”的引用,但内容是对重要性测试的作用的广泛讨论。)


1
即使结果正确,我也可能建议他们放弃这些小星星,但我明白您的意思。
晚会

1
我编辑了答案,以添加有关此问题的评论。请注意,0.001 <0.01,因此在任何情况下作者都是正式的“正确”,这更多地取决于报告结果所暗示的方式。我认为,与审阅者当然应该纠正的彻底错误不同,应该由作者决定这个问题。
庆典

1
您是对的,但到目前为止,如果p实际小于0.001(无需说商品的置信度为0.01),我从未见过报告p <0.01。此外,在我所谈论的文章中,作者报告了30个相关性测试,这些测试基于837至886的样本量,相关性介于0.145至0.754之间,并且全部被报告为具有2星显着性。
Miroslav Sabo 2013年

1
我在此处发布代码时遇到问题,但是我运行模拟,并且您代码中的p值与cor.test中的p值不同。
Miroslav Sabo

4
我写了一篇有关使用Fisher的z进行相关性的教程综述,可从stata-journal.com/sjpdf.html?articlenum=pr0041访问。我建议更多使用置信区间,并计算0.724、0.781作为95%的限制。我建议您更多地查看数据并进行回归分析。
Nick Cox

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.