剖分方差分析:R中的模型比较测试


12

如何使用R中的XM参数使用合适的模型比较来测试分割图方差分析中的效果anova.mlm()?我熟悉?anova.mlmDalgaard(2007)[1]。不幸的是,它只能刷分割图设计。在具有两个受试者内部因素的完全随机设计中进行此操作:

N  <- 20  # 20 subjects total
P  <- 3   # levels within-factor 1
Q  <- 3   # levels within-factor 2
DV <- matrix(rnorm(N* P*Q), ncol=P*Q)           # random data in wide format
id <- expand.grid(IVw1=gl(P, 1), IVw2=gl(Q, 1)) # intra-subjects layout of data matrix

library(car)        # for Anova()
fitA <- lm(DV ~ 1)  # between-subjects design: here no between factor
resA <- Anova(fitA, idata=id, idesign=~IVw1*IVw2)
summary(resA, multivariate=FALSE, univariate=TRUE)  # all tests ...

以下模型比较得出相同的结果。受限模型不包括所讨论的效果,而是所有其他相同或更低阶的效果,完整模型会添加所讨论的效果。

anova(fitA, idata=id, M=~IVw1 + IVw2, X=~IVw2, test="Spherical") # IVw1
anova(fitA, idata=id, M=~IVw1 + IVw2, X=~IVw1, test="Spherical") # IVw2
anova(fitA, idata=id, M=~IVw1 + IVw2 + IVw1:IVw2,
                      X=~IVw1 + IVw2, test="Spherical")          # IVw1:IVw2

一种Split-Splot设计,其中一个在对象之间,一个在对象之间。

idB  <- subset(id, IVw2==1, select="IVw1")          # use only first within factor
IVb  <- gl(2, 10, labels=c("A", "B"))               # between-subjects factor
fitB <- lm(DV[ , 1:P] ~ IVb)                        # between-subjects design
resB <- Anova(fitB, idata=idB, idesign=~IVw1)
summary(resB, multivariate=FALSE, univariate=TRUE)  # all tests ...

这些是anova()用于复制测试的命令,但我不知道它们为什么起作用。为什么以下模型比较的测试得出相同的结果?

anova(fitB, idata=idB, X=~1, test="Spherical") # IVw1, IVw1:IVb
anova(fitB, idata=idB, M=~1, test="Spherical") # IVb

两个主体内因素和一个主体间因素:

fitC <- lm(DV ~ IVb)  # between-subjects design
resC <- Anova(fitC, idata=id, idesign=~IVw1*IVw2)
summary(resC, multivariate=FALSE, univariate=TRUE)  # all tests ...

如何复制上面给出与使用相应的模型进行比较的结果XM论点anova.mlm()?这些模型比较背后的逻辑是什么?

编辑:suncoolsu指出,出于所有实际目的,应使用混合模型分析这些设计的数据。但是,我仍然想了解如何复制summary(Anova())with 的结果anova.mlm(..., X=?, M=?)

[1]:Dalgaard,P。2007。多元分析的新功能。R新闻,7(2),2-7。


嘿,@ caracal,我认为您使用“分割图设计”的方式不像Casella所定义,George在他的书《统计设计》中定义了它。Split Plot肯定是在谈论嵌套,但是它是施加相关结构的一种特殊方式。而且大多数情况下,您最终将使用lme4包来拟合模型,而没有使用lm。但这可能是一个非常具体的基于书本的视图。我会让其他人对此发表评论。我可以根据我的解释给出一个与您不同的示例。
suncoolsu 2011年

2
@suncoolsu社会科学中的术语可能有所不同,但是Kirk(1995,p512)和Maxwell&Delaney(2004,p592)都将模型称为要素间分裂图和要素内分裂图。中间因素提供“图”(类似于农业来源)。
caracal

目前,我盘子里有很多东西。我将扩大我的答案,使其更具体地针对您的问题。我看到您为解决问题付出了很多努力。感谢那。
suncoolsu 2011年

Answers:


10

XM主要指定要比较两个模型,但仅在的对象内的影响范围; 然后它显示了与受试者内效应对于所有受试者间效应(包括截距)的相互作用的结果,改变之间XM

你的例子就fitB比较容易理解,如果我们添加默认值XM

anova(fitB, idata=idB, M=~1, X=~0, test="Spherical") # IVb
anova(fitB, idata=idB, M=diag(3), X=~1, test="Spherical") # IVw1, IVw1:IVb

第一个模型是从无主观效果(均具有相同的均值)到各有不同的均值的变化,因此我们添加了id随机效果,这是测试整体拦截和整体主观效果之间的正确选择上。

第二种模式是广告id:IVw1互动,这是正确的测试IVw1和针对的IVw1:IVb条件。由于只有一个主体内效应(具有三个级别)diag(3),第二个模型中的缺省值将解决这个问题;这相当于运行

anova(fitB, idata=idB, M=~IVw1, X=~1, test="Spherical") # IVw1, IVw1:IVb

对于您fitC,我相信这些命令将重新创建Anova摘要。

anova(fitC, idata=id, M=~1, X=~0, test="Spherical") #IVb
anova(fitC, idata=id, M=~IVw1 + IVw2, X=~IVw2, test="Spherical") # IVw1
anova(fitC, idata=id, M=~IVw1 + IVw2, X=~IVw1, test="Spherical") # IVw2
anova(fitC, idata=id, M=~IVw1 + IVw2 + IVw1:IVw2,
                  X=~IVw1 + IVw2, test="Spherical")          # IVw1:IVw2

现在,您已经发现,这些命令确实很棘手。幸运的是,没有太多理由再使用它们。如果您愿意采用球形度,则应该使用aov,或者使用更简单的语法,lm自己使用并计算正确的F检验。如果您不愿意采用球形度,那么使用lmeGG方法确实可以,因为与GG和HF校正相比,它具有更大的灵活性。

例如,这是您的aovlm代码fitA。您确实需要首先使用长格式的数据。这是一种方法:

library(reshape)
d0 <- data.frame(id=1:nrow(DV), DV)
d0$IVb <- IVb
d0 <- melt(d0, id.vars=c(1,11), measure.vars=2:10)
id0 <- id
id0$variable <- factor(levels(d0$variable), levels=levels(d0$variable))
d <- merge(d0, id0)
d$id <- factor(d$id)

这是lm andaov`的代码:

anova(lm(value ~ IVw1*IVw2*id, data=d))
summary(aov(value ~ IVw1*IVw2 + Error(id/(IVw1*IVw2)), data=d))

非常感谢,这正是我想要的!我仍然对这里描述anova()的问题感兴趣。但是您的最后建议同样有效,也更简单。(次要事情:我认为最后2行都缺少1个右括号,它应该显示为)Anova()Error(id/(IVw1*IVw2))
caracal

8

分割图设计起源于农业,因此得名。但是它们经常发生,我会说-大多数临床试验的主力军。主图以一个因子的水平处理,而其他因子的水平则随子图的变化而变化。该设计是由于完全随机化的限制而产生的。例如:一个字段可以分为四个子图。可能在子地块中种植不同的品种,但整个田地只能使用一种灌溉类型。不是拆分之间的区别。块是实验单元的功能,我们可以选择在实验设计中加以利用,因为我们知道它们在那里。另一方面,拆分对可能的因素分配施加了限制。它们对设计提出了要求,以防止完全随机化。

它们在临床试验中被大量使用,当一个因素容易改变而另一因素需要更多的时间改变时。如果实验人员必须连续进行每个级别的难更改因子的所有运行,那么将生成一个拆分图设计,其中难更改因子代表整个绘图因子。

这是一个示例:在一个农业田间试验中,目标是确定两种作物品种和四种不同灌溉方法的效果。共有八个农田,但每个农田只能使用一种灌溉方式。字段可以分为两个部分,每个部分的种类不同。整个地块因子是灌溉,应将其随机分配给田地。在每个字段中,分配品种。

这是您在以下方面的方法R

install.packages("faraway")
data(irrigation)
summary(irrigation)

library(lme4)

R> (lmer(yield ~ irrigation * variety + (1|field), data = irrigation))
Linear mixed model fit by REML 
Formula: yield ~ irrigation * variety + (1 | field) 
   Data: irrigation 
  AIC  BIC logLik deviance REMLdev
 65.4 73.1  -22.7     68.6    45.4
Random effects:
 Groups   Name        Variance Std.Dev.
 field    (Intercept) 16.20    4.02    
 Residual              2.11    1.45    
Number of obs: 16, groups: field, 8

Fixed effects:
                       Estimate Std. Error t value
(Intercept)               38.50       3.02   12.73
irrigationi2               1.20       4.28    0.28
irrigationi3               0.70       4.28    0.16
irrigationi4               3.50       4.28    0.82
varietyv2                  0.60       1.45    0.41
irrigationi2:varietyv2    -0.40       2.05   -0.19
irrigationi3:varietyv2    -0.20       2.05   -0.10
irrigationi4:varietyv2     1.20       2.05    0.58

Correlation of Fixed Effects:
            (Intr) irrgt2 irrgt3 irrgt4 vrtyv2 irr2:2 irr3:2
irrigation2 -0.707                                          
irrigation3 -0.707  0.500                                   
irrigation4 -0.707  0.500  0.500                            
varietyv2   -0.240  0.170  0.170  0.170                     
irrgtn2:vr2  0.170 -0.240 -0.120 -0.120 -0.707              
irrgtn3:vr2  0.170 -0.120 -0.240 -0.120 -0.707  0.500       
irrgtn4:vr2  0.170 -0.120 -0.120 -0.240 -0.707  0.500  0.500

基本上,该模型所说的是,灌溉和多样性是固定的影响,而多样性嵌套在灌溉中。这些字段是随机效果,并且在图形上将类似于

I_1 | I_2 | I_3 | I_4

V_1 V_2 | V_1 V_2 | V_1 V_2 | V_1 V_2

但这是一个特殊的变体,具有固定的整体绘图效果和子绘图效果。可能有一个或多个是随机的变体。可能会有更复杂的设计,例如拆分-..情节设计。基本上,你可以去野生和疯狂。但是,只要清楚地理解其基本结构和分布(即固定或随机,嵌套或交叉,..)lmer-Ninja,建模就不会有麻烦。可能解释会一团糟。

关于比较,假设您有lmer1lmer2

anova(lmer1, lmer2)

会根据chi-sq测试统计量为您提供适当的测试 ,且自由度等于参数之差。

cf:Faraway,J。,用R扩展线性模型。

Casella,G.,统计设计


我很感谢介绍混合效果模型和更多背景信息的剖分设计入门!当然,这是进行分析的首选方法。我已经更新了我的问题,以强调我仍然想知道如何执行此“旧方法”。
caracal
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.