使用Fisher变换对三个或更多相关性进行显着性检验


9

据我所知,在我之前的文章中,如果我具有三个相关系数,则必须成对测试它们,以查看它们之间是否存在显着差异。

这意味着我将不得不使用Fishers变换来计算r的z得分,然后计算z的p值(谢天谢地,在先前的文章中推荐的计算器可以做到这一点),然后确定p值是高于还是低于p每对我的alpha值(0.05)。

例如,如果21至30岁的年龄段为1岁,而31至40岁的年龄段为2岁,而41至50岁的年龄段为2岁,那么他们的购物习惯和减肥之间的相关性比较如下:

  • 第一组vs第二组
  • 第一组vs第三组
  • 第2组与第3组

除了执行三个单独的计算,还有没有办法在一个步骤中完成所有这些计算?


1
您能否再详细一点?就像-您的回答是什么,您的解释变量是什么,您对什么相关感兴趣?您可能没有费舍尔变换来测试相关性,简单的t检验可能就足够了。
suncoolsu 2011年

@suncoolsu我正在测试这三个群体的购物习惯和体重增加之间的相关性。我的结果如下:第1组:r = .8978,n = 105;第2组:r = .5678,n = 95;组3:r = .7865,n = 120。
Adhesh Josh 2011年

我认为您的数据通过了IOTT。那是眼内创伤测试-击中您的眼睛。如果.9,.6和.8的相关性互不相同,那是什么?但是,如果您真的有兴趣
彼得·弗洛姆

Answers:


4

您的问题是具有定量定性预测变量的回归模型的完美示例。具体来说,三个年龄组 是定性变量,定量变量是购物习惯减肥(我猜是因为您正在计算相关性)。1,2,&3

我必须强调,这是一种比计算单独的逐组相关性更好的建模方法,因为您要建模的数据更多,因此误差估计(p值等)将更加可靠。一个更技术性的原因是,用于检验回归系数的显着性的t检验统计量具有更高的自由度。

根据定性预测变量可以由指标变量处理的规则进行操作,此处仅需要两个指标变量,它们的定义如下:cc1X1,X2

X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.

这意味着第组由;用表示您的反应-购物习惯,用表示定量的可变体重减轻量。您现在适合此线性模型3X1=0,X2=0YW

E[Y]=β0+β1X1+β2X2+β3W.
一个明显的问题是,是否改变和(因为我随机选择购物习惯作为响应变量)。答案是肯定的。回归系数的估计值将发生变化,但是对以组为条件的组之间的“关联”进行的检验(此处为t检验,但与针对单个预测变量的相关性检验相同)不会更改。具体来说,WY

E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
,如果您绘制与则相当于有3条不同的线,具体取决于各组。这是一种可视化测试目的的好方法(基本上是EDA和模型检查的一种形式,但是您需要正确区分分组的观察结果)。三个平行线表示三组和之间没有相互作用,并且很多相互作用意味着这些线将彼此相交。YWW

您要求的测试方法如何。基本上,一旦您拟合模型并获得估计,就需要测试一些对比。专为您进行比较:

Group 2 vs Group 3: β2+β0β0=0,
Group 1 vs Group 3: β1+β0β0=0,
Group 2 vs Group 1: β2+β0(β0+β1)=0.

斜率的等效性测试与相关性的等效性测试不同。参见例如:jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang

我同意,但是对于单个预测变量,由于这种关系。t=ρn21ρ2tn2
suncoolsu 2011年

此外,您的文档还讨论了比较不同的总体,而不是单一预测变量。
suncoolsu 2011年

关键是可能为真,而可能为假(反之亦然)。X和Y之间的相关性不仅取决于,而且取决于X的方差和误差的方差。如果X的方差和/或误差在3个组中不同,则您正在检验不同的假设。H0:β1=β2=β3H0:ρ1=ρ2=ρ3β
沃尔夫冈·

是的,您是对的(如我之前所说),但是我的回答是假设运营商有兴趣根据群体(不一定是相关性)确定重量损失与购物习惯之间的关系。我想我错了,因为OP接受了另一个答案。尽管如此,这个答案还是一个有用的选择(我希望)。
suncoolsu 2011年

1

数据描述还不能证明在这种情况下的成对测试。您应该使用多变量回归方法。R呼叫可能是:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

构造3个类别并不是控制年龄的最佳方法(如果这是主要问题,则不是分析其贡献),因为分类会扭曲连续的关系,并且样条项消除了选择任意分割点的需要。在进行了适当的分析之后,一旦有足够的证据表明体重变化相关联,那么便可以使用临时测试选项。

(我确实同意@whuber在评论中表达的大部分内容,并且我通常认为他的评论具有权威性,但不理解他对回归方法的立场。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.