如果我对交互不感兴趣,是否有理由运行双向ANOVA而不是两个单向ANOVA?


9

我的意思是除了能够在单个过程中完成分析的便利性之外,还有其他原因。


1
事情是这样的:如果存在交互作用,那么“对它不感兴趣”就没有任何意义,因为如果存在交互作用,您将无法单独有意义地解释主要效果。因此,除了下面的答案外,我敦促您重新考虑您在做什么。
Erik

Answers:


19

是的,有几个原因!

1)辛普森悖论。除非设计是平衡的,否则如果其中一个变量影响结果,那么即使不调整第一个变量,也无法正确评估另一个变量的作用方向(尤其请参见链接中的第一个图,具体如下: **)。这说明了问题-组内效果正在增加(两条彩色线),但是如果忽略红蓝色组,则会得到减小的效果(虚线灰色线)-完全是错误的信号!

在此处输入图片说明

尽管这表明一个连续变量和一个分组变量的情况,但是当不平衡的双向主效应ANOVA被视为两个单向模型时,也会发生类似的情况。

2)假设有一个完全平衡的设计。然后您仍然想要这样做,因为如果您在看第一个变量时忽略了第二个变量(假设两者都有一定影响),那么第二个变量的效果就进入了噪声项,使它膨胀……从而使所有标准偏差错误向上。在这种情况下,重要的和重要的效果可能看起来像噪音。

考虑以下数据,连续响应和两个名义分类因素:

      y x1 x2
1  2.33  A  1
2  1.90  B  1
3  4.77  C  1
4  3.48  A  2
5  1.34  B  2
6  4.16  C  2
7  5.88  A  3
8  2.56  B  3
9  5.97  C  3
10 5.10  A  4
11 2.62  B  4
12 6.21  C  4
13 6.54  A  5
14 6.01  B  5
15 9.62  C  5

方差分析的两种主要影响非常重要(因为平衡,顺序无关紧要):

Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value    Pr(>F)    
x1         2 26.644 13.3220  24.284 0.0004000 
x2         4 38.889  9.7222  17.722 0.0004859 
Residuals  8  4.389  0.5486                      

但是单个方差分析在5%水平上并不显着:

(1) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x1         2 26.687 13.3436  3.6967 0.05613 
Residuals 12 43.315  3.6096                  

(2) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x2         4 38.889  9.7222  3.1329 0.06511 
Residuals 10 31.033  3.1033                  

请注意,在每种情况下,因子的均方均不变...但是剩余均方值急剧增加(每种情况下从0.55增至3以上)。那是忽略重要变量的结果。

** (以上图表是由Wikipedia用户Schutz制作的,但位于公共领域;尽管公共领域中的项目不需要提供属性,但我认为这是值得认可的)


6

是。如果两个自变量相关且/或ANOVA不平衡,则采用ANOVA的两种方式向您显示每个变量控制另一个变量的效果。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.