相关系数= 0.2是否表示“只有五分之一的人”存在关联?


48

迪恩·伯内特 Dean Burnett 《白痴的大脑:神经科学家解释你的头到底在做什么》一书中

身高和智力之间的关系通常被引用为约,这意味着身高和智力似乎只待相关15人。0.215

对我来说,这听起来是错误的:我更了解相关性,就像我们试图预测一个量度(此处为智力)时所得到的(缺乏)错误一样,如果我们唯一了解的那个人是另一个量度(此处为身高)。如果相关系数为1,则我们的预测中不会出错,如果相关系数为0.8,则误差更大。因此,相关性将适用于任何一个,而不是仅仅1中的5人。110.815

我已经看过这个问题,但是我的数学能力不足以理解答案。这个关于线性关系强度的答案似乎符合我的理解,但我不确定。


6
@JamesPhillips,您指的是,而不是r本身。如果r = 0.2,r 2 = 0.04,即4%。r2rr=0.2r2=0.04
理查德·哈迪

4
4%比20%更有意义,谢谢您的纠正,我同意。
James Phillips

29
这本书的0.01%样本使我想知道其余的东西是什么废话……
Nick Cox

11
我喜欢这篇文章,因为这是一个非常简单的问题,当被问到001统计数据的学生(或任何其他新手或求职者)时,它将立即毫无疑问地确定他们是否了解关联的含义。
ub

4
我马上就要停止阅读那本书
博士

Answers:


69

引用的段落确实是不正确的。相关系数可量化整个总体(或样本,在样本相关系数的情况下)的关联度。它不会将总体分为一部分,一部分显示关联,而另一部分则没有。这可能是人口实际上由两个亚群与不同关联度的情况下,但单独的相关系数并不意味着这一点。


19
而且,即使在20%的人的身高和智力之间显示出完美的相关性,而80%的人显示出零相关性的情况下,整个人群的相关性也不一定是0.2。该声明在几种方面是错误的!
核王

进入“热网络”列表的线程会发生奇怪的事情。这个答案显然是正确的,但很好……但是有57个投票?:-)
变形虫说恢复莫妮卡

2
@amoeba如果您认为这很疯狂,请查看我得分最高的答案
Kodiologist '18

哈哈,你是主人!
变形虫说恢复莫妮卡

仅仅为了进一步增加SE的陌生度就算是为某些事情+1了吗?
纳特

18

不,0.2并不意味着五分之一的人显示出相关性。我不知道他怎么写这个废话。

这是0.2的来源:“关于高度-智力相关性的来源:来自具有配对配合的双变量ACE模型的新见解”,https: //www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ 显然,相关性很强。

我已经知道了:随着我的高大,我的智商随着身高而大大提高。现在我知道为什么我不再变得更聪明了:我的身高很稳定。

当然,这是个玩笑,但它指出了“白痴”一书作者的论点的问题:据我所知,没有人在身高和智商的主题相关性上进行测量。我不确定您会怎么做,会有很多困惑。

话虽如此,研究人员正在使用一些技巧,例如在双胞胎中以及在身高和智商的家庭关联中进行观察,这有助于他们解决令人困惑的问题。据推测,双胞胎在相似的环境中成长且具有相同的DNA,因此在观察研究中,它有助于解决内生性和其他问题。但是,如果将其全部搁置一旁,最重要的是,“ 0.2相关性”没有理由说废话,就像在某些人中存在相关性而在其他人中则没有相关性一样。这只是对相关研究结果的荒谬解释。


8
-1:虽然我理解此答案最后一段的精神,但我相信它会增加混乱,因为它不必要地引入了因果关系的概念(why此处不相关)。
豪尔赫·雷涛

1
您必须是与之相关的五分之一。
卡斯顿S

@JorgeLeitão当然不是,没有任何因果关系,它们一起成长,这是相互关联的!:)
Firebug '18

@JorgeLeitão,如果有任何NN研究表明大小很重要。更大的大脑和更大的样本。因此,当我们长大后,我们的大脑就会增加,并且通过它们运行更多的东西,因此,我们应该变得更聪明。另外,男人平均比女人高,因此,他们平均也必须更聪明。
阿克萨卡(Aksakal)'18

哈哈,真是胡说八道。
与莫妮卡(Monica)进行的轻度比赛

8

声明中的讽刺意味太深,无法解析。给定文本的标题,我假设是要用嘲讽的态度。但是,如果直觉很重要,那么您的“直觉”说这是错误的,这可能是正确的。不幸的是,在处理我们从未遇到过的概念时,很多科学报告都没有直觉。

XYXYXY

以上只是相关性0.2的一种可能解释;这是非常牵强的,因为生活中很少有事物具有1或0的相关性,而更少的事物仍然具有足够强大的效果修饰以产生这样的差异性相关性。


1
“有可能在测量X和Y之间的关联时,X和Y之间的相关性在20%的人口中为1.0,在其余80%的人口中为0。” -在我发布的研究中,他们研究了家庭内部以及双胞胎之间的相关性,它们与总体人口不同。但是,我确定这不是本书作者的意思,而是他解释问题的相关性的方式
Aksakal,

@Aksakal有趣的是,这些方差分量方法旨在估计与在人群中测量的相同的人群水平相关性,他们只是声称使用遗传力来“消除”归因于当前环境影响的表型方差(ACE的E分量模型):在所考虑的假设中混淆的重要来源。
AdamO

10
如果相关性是20%的人口中的1,而80%的人口中的0,则不符合总体的0.2。取决于每个子群体中的相对方差。
变形虫说恢复莫妮卡

1
@amoeba是的,很好,进一步强调了特发性情况将证明这种说法是合理的。
AdamO '18

4
“我以为是用舌头嘲弄。” 你比我更慈善。这是完全错误的。我没有任何理由认为作者故意以一种聪明的方式犯了错。最慈善的解释是,作者想强调相关性的概率性质,并且不加思索地选择了一种不好的方式来说明这种关系,如果本人指出这一点,那么他本人可能会同意的这种方式实际上并没有任何意义。
John Coleman '18

2

很难对此做出有意义的解释,更不用说正确了。关联不是单个数据点的属性。如果您只有一个人的身高和智力,您怎么可能说身高和智力是否相关?我想,如果我们拥有平均身高和智力的平均值,那么我们可以说,高于和低于均值的每个人都显示出“联系”。但是,如果您拥有完全随机的数据(没有相关性),则应该期望有一半的人在这种意义上表现出“关联”。我生成了一个随机数据集,其相关系数约为0.2(实际上为0.22),发现55在这种意义上显示出“关联”。

Y可能是X的递增函数,它们之间的相关性仅为0.5;愚蠢地说,如果每个人的智力都比矮个子高,而每个人的智力都比个高的人低,那么只有一半的人表现出联想。此外,从理论上讲,可以有一个异常值来创建所有相关,并且没有该点的集合的相关为零。甚至有可能使20%的人口具有负相关性,而其他80%的人口也具有负相关性,而总相关性为0.2。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.