这个问题显然来自一项研究,该研究采用不平衡的双向设计,并在R中对该aov()
函数进行了分析。此页面提供了此问题的更新和详细示例。
对于这个问题,一般的答案是:“取决于情况”。在此取决于设计是否平衡,如果不平衡,则取决于选择哪种方差分析。
首先,这取决于设计是否平衡。在所有可能的情况中,在析因设计的所有像元中案件数量相等的情况下,无论如何执行ANOVA,将因素输入模型的顺序都不会有任何区别。*显然,来自回顾性临床队列研究似乎来自现实世界,而这种现实并未找到这种平衡。因此顺序可能很重要。
其次,它取决于方差分析的执行方式,这是一个有争议的问题。不平衡设计的ANOVA类型在评估主要效果和相互作用的顺序上有所不同。评估相互作用是双向高阶方差分析的基础,因此,关于最佳处理方式存在争议。请参阅此交叉验证页面以获取一种解释和讨论。请从包装手册中的详细信息和警告Anova()
(带有大写字母“ A”)功能的警告中查看不同的car
包装。
在R 的默认设置下,因子的顺序在不平衡设计中很重要aov()
,它使用所谓的I型测试。如当前问题所设想的,这些是按进入模型的顺序对因素的方差的顺序归因。顺序与R 中包装中的功能所提供的II型或III型测试无关。但是,这些替代方案在上述链接中指出了自己的潜在缺点。Anova()
car
最后,考虑与lm()
R中的多元线性回归的关系,如果包括交互项,则该关系基本上是同一类型的模型。变量的输入顺序与所报告lm()
的回归系数和p值无关summary(lm())
,其中k级分类因子被编码为(k-1)个二进制虚拟变量,并且每个虚拟变量都报告了回归系数。
但是,可以像在ANOVA中期望的那样,lm()
用anova()
(用R stats
包中的小写字母“ a” 包装)输出,或Anova()
总结每个因素对其所有水平的影响。然后因素排序会与物质anova()
作为aov()
,并不会没关系Anova()
。同样,关于使用哪种方差分析的争议也会再次出现。因此,在lm()
模型的所有下游使用中假设因子输入的顺序独立性是不安全的。
*在所有单元格中具有相等数量的观测值就足够了,但是据我所知,对于因子顺序无关紧要的情况,这不是必需的。要求不高的余额类型可以允许订单独立。