平均相关系数的意义


11

免责声明:如果您发现这个问题与另一个问题过于相似,我很高兴将其合并。但是,我在其他任何地方都找不到满意的答案(并且还没有“声誉”来发表评论或投票),所以我认为最好自己问一个新问题。

我的问题是这个。对于12个人类受试者中的每一个,我已经计算出自变量X的6个水平与因变量Y的相应观察值之间的相关系数(斯皮尔曼Rho)。(注意:受试者之间X的水平不相等。)零假设是,在一般人群中,这种相关性等于零。我用两种方法检验了这个假设:

  1. 对我的12个受试者获得的相关系数进行一次样本t检验。

  2. 通过将我的X水平和Y观测值居中,使得每个参与者的均值(X)= 0和均值(Y)= 0,然后计算汇总数据之间的相关性(72个X水平和72个Y观测值) 。

现在,从阅读有关使用相关系数(在这里和其他地方)的知识开始,我开始怀疑第一种方法是否有效。特别是,我看到以下方程式在几个地方突然出现,(显然)表示为平均相关系数的t检验:

Ť=[R小号Ë[R=ñ-21个-[R2

其中,是平均相关系数(假设我们首先使用每个对象系数的Fisher变换获得了该系数),是观察数。直觉上,这对我来说似乎是错误的,因为它不包含任何受试者间变异性的度量。换句话说,如果我具有3个相关系数,则无论它们是[0.1、0.5、0.9]还是[0.45 0.5 0.55]还是任何均值相同(且)的值,我都会得到相同的t统计量n n = 3[Rññ=3

因此,我怀疑上面的方程式在检验相关系数平均值的显着性时实际上不适用,而在基于2个变量的观察值检验单个相关系数的显着性时实际上并不适用。ñ

在座的任何人都可以确认这种直觉或解释为什么错了吗?另外,如果此公式不适用于我的情况,是否有人知道正确的方法?也许我自己的测试编号2已经有效?非常感谢您的任何帮助(包括指向我可能遗漏或误解的先前答案的指针)。


2
Pearson的对居中和缩放转换不敏感,因此我认为居中与您的问题无关。例如,COR(X ÿ)= COR(X ÿ - ˉ Ý)= COR(X ÿ + 1000)= COR(X ÿ × 1000)。[RXÿXÿ-ÿ¯Xÿ+1000Xÿ×1000
Alexis

我同意你的看法。这就是为什么我将居中解释为“在将每个变量放在一起之前分别居中”。
Federico Tedeschi

1
@FedericoTedeschi是不是“把它们放在一起之前单独围绕每个变量” 手段?YY¯
亚历克西斯(Alexis)2017年

@Alexis我已经在回答的最底部回复了您(在注释中写它太长了,由于所见即所得的问题,我也不得不多次更正它)。
Federico Tedeschi

Answers:


2

分析此数据的更好方法是使用具有随机效果(随机截距或随机截距+斜率)的(又称混合效果模型,分层模型subject)。总结一下我的另一个答案

从本质上讲,这是一个建模单个整体关系的回归,同时允许该关系在各组(人类受试者)之间有所不同。这种方法得益于部分池化,可以更有效地使用数据。


-1

我假设所有个人的变量(6个X6个Y)都是相同的(实际上,我不确定我说的是各个科目的水平不相等,我是否理解你的意思:我希望你是是指变量范围之间的独立性,而不是针对每个个体要测量哪些变量)。是的,您显示的公式适用于两个变量之间的相关系数。126 X6 Y

在第2点中,您将讨论规范化:我认为如果分别对变量中的每个变量进行归一化,这将是有意义的。但是,即使这样,这种方法的问题还是不能控制个体内部的依赖性。62

我相信您的方法1也不成立,因为这将是在分布变量t仅具有10个自由度的情况下进行的检验,因此我认为您不能在这种情况下应用中心极限定理。6t10

也许,对于更大的数字,您可以使用随机效应方法,允许随机斜率,并同时测试零平均系数(Y i上)和随机系数的不存在。我相信,只有6个变量和12个观察值不足以做到这一点。X一世ÿ一世

我建议您将其视为对变量(XY)中相关矩阵的6个值(如果还考虑对角线以下的值,则为12)的测试,即对第二个对角线(和相当于第3个象限。因此,我将在受限模型和非受限模型之间进行似然比检验。12Xÿ

@Alexis我的理解是,围绕ÿ 1... ÿ 6,用替换它们X * 1 = X 1 - ¯ X 1... X * 6 = X 6 - ¯ X 6ÿ * 1 = Ÿ 1 - ¯ Ÿ 1... ÿ *X1个X6ÿ1个ÿ6才有意义(我想这也将是有意义的划分他们自己的小号Ë的)。通过这种方式,变量X*ÿ*(通过考虑创建X * 16,好像他们是唯一的变量的出现,与同为Ÿ * )都会有一个0均值。相反,如果我们先构建两个变量X,则Y(通过考虑X创建)X1个=X1个-X1个¯X6=X6-X6¯ÿ1个=ÿ1个-ÿ1个¯ÿ6=ÿ6-ÿ6¯小号ËXÿXi,1i6Yi0X,Y如同它们是一个唯一的变量的出现,与同为 ÿ ),那么当然减去平均值(并且还通过的SE除以 X ÿ)不会改变的东西。Xi,1i6YiXY

编辑01/01/18

表示可变和Ĵ1 Ĵ 12)的个人。然后,假设我们有:ij1j12

;X1j=Y1j=10,j

;X2j=Y2j=8,j

;X3j=Y3j=6,j

;X4j=Y4j=4,j

;X5j=Y5j=2,j

X6j=Y6j=j,j

在这种情况下,相关系数应为0.5428

如果我们中心的每个变量,因为,对于,既X ÿ 有没有变化,我们有:X * Ĵ = ý * Ĵ = 0。作为用于= 6,我们得到值X * 6 Ĵ = Ĵ - 6.5 ÿ * Ĵ 6 = 13 - Ĵ - 6.5 = 6.5 -1i5XiYiXij=Yij=0i=6(即,对于 X的: - 5.5 - 4.5 - 3.5 - 2.5 - 1.5 - 0.5 0.5 1.5 2.5 3.5 4.5 5.5,和完全相反的 ÿ的) 。由于 0 = 0 j 6.5 = 6.5 j ,我们得到: X X6j=j6.5,Yj6=(13j)6.5=6.5jX-5.5-4.5-3.5-2.5-1.5-0.50.51.52.53.54.55.5ÿ0=0j6.5=(6.5j),暗示的相关-1Xij=Yiji,jX=Y1


如果我们遵循第二步,那么我同意你的看法。这就是为什么我相信Ruben van Bergen的意思是我在第一个步骤中所描述的。在这种情况下,我们有:,但Ç ø - [R X ÿ = c ^ Ö - [R X Y cor(Xi,Yi)=cor(Xi,Yi),icor(X,Y)=cor(X,Y)通常是不正确的。我正在编辑帖子以显示反例。
Federico Tedeschi '18年

给人的相关值是:X = 10 10 10 10 10 10 10 10 10 10 10 10 8 8 8 8 8 8 8 8 8 8 8 8 6 6 0.5428 ; Ý = 10 10 10 10 10 10 10 10 10 10 10 8 8 8X=10,10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,1,2,3,4,5,6,7,8,9,10,11,12。关联是否真的为 0.5428并不重要Y=10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,12,11,10,9,8,7,6,5,4,3,2,10.5428,因为它明显不同于1
Federico Tedeschi

之间的相关性 X * = 0 0 0 0 0 0 0 0 0 0 0 X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5 - 1。您说 X = 1 12 Y = 12 1导致 C o r X Y = c o r X Y = 1的事实是正确的,但这仅是事实表示 c o r X iX=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.51X=1,,12Y=12,,1cor(X,Y)=cor(X,Y)=1,这就是我已经写过的东西。cor(Xi,Yi)=cor(Xi,Yi)
Federico Tedeschi

当然:这是相关的不变性到线性变换的结果。这是我在第一条评论中已经达成的共识:“我同意您的意见。这就是为什么我将居中解释为“在将各个变量放在一起之前将每个变量分别居中”。” – Federico Tedeschi 17年12月27日,10CØ[RX;ÿ=CØ[RX-X¯;ÿ-ÿ¯
Federico Tedeschi

也许,我不明白“将每个变量集中在一起之前分别将它们居中”的含义。对我来说,方法X 1 - ˉ XX 2 - ˉ X... X ñ - ˉ X是“把它们放在一起之前单独围绕每个变量”。您能帮助我理解我们明显不同的理解吗?X-X¯X1个-X¯X2-X¯Xñ-X¯
亚历克西斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.