是的,有几个原因!
1)辛普森悖论。除非设计是平衡的,否则如果其中一个变量影响结果,那么即使不调整第一个变量,也无法正确评估另一个变量的作用方向(尤其请参见链接中的第一个图,具体如下: **)。这说明了问题-组内效果正在增加(两条彩色线),但是如果忽略红蓝色组,则会得到减小的效果(虚线灰色线)-完全是错误的信号!
尽管这表明一个连续变量和一个分组变量的情况,但是当不平衡的双向主效应ANOVA被视为两个单向模型时,也会发生类似的情况。
2)假设有一个完全平衡的设计。然后您仍然想要这样做,因为如果您在看第一个变量时忽略了第二个变量(假设两者都有一定影响),那么第二个变量的效果就进入了噪声项,使它膨胀……从而使所有标准偏差错误向上。在这种情况下,重要的和重要的效果可能看起来像噪音。
考虑以下数据,连续响应和两个名义分类因素:
y x1 x2
1 2.33 A 1
2 1.90 B 1
3 4.77 C 1
4 3.48 A 2
5 1.34 B 2
6 4.16 C 2
7 5.88 A 3
8 2.56 B 3
9 5.97 C 3
10 5.10 A 4
11 2.62 B 4
12 6.21 C 4
13 6.54 A 5
14 6.01 B 5
15 9.62 C 5
方差分析的两种主要影响非常重要(因为平衡,顺序无关紧要):
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.644 13.3220 24.284 0.0004000
x2 4 38.889 9.7222 17.722 0.0004859
Residuals 8 4.389 0.5486
但是单个方差分析在5%水平上并不显着:
(1) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.687 13.3436 3.6967 0.05613
Residuals 12 43.315 3.6096
(2) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x2 4 38.889 9.7222 3.1329 0.06511
Residuals 10 31.033 3.1033
请注意,在每种情况下,因子的均方均不变...但是剩余均方值急剧增加(每种情况下从0.55增至3以上)。那是忽略重要变量的结果。
** (以上图表是由Wikipedia用户Schutz制作的,但位于公共领域;尽管公共领域中的项目不需要提供属性,但我认为这是值得认可的)