这更多是一个概念性问题,但是在我使用时,R
我将参考中的软件包R
。如果目的是为了进行预测而拟合线性模型,然后在可能无法获得随机效应的情况下进行预测,那么使用混合效应模型有什么好处,还是应该使用固定效应模型?
例如,如果我有重量与高度数据以及其他一些信息,并且使用构建以下模型lme4
,其中受试者是具有因子水平(Ñ = Ñ Ö 。小号一米p 升Ë 小号):
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
然后,我希望能够使用新的身高和年龄数据从模型中预测体重。显然,原始数据的个体差异是在模型中捕获的,但是可以在预测中使用此信息吗?假设我有一些新的身高和年龄数据,并且想要预测体重,我可以这样做:
predict(mod1,newdata=newdf) # newdf columns for height, age, subject
这将使用predict.merMod
,并且我可以在newdf
或set中为(新)主题添加一列re.form =~0
。在第一种情况下,尚不清楚模型如何处理“新”主观因素,在第二种情况下,是否会简单地忽略(平均)模型中捕获的个体差异以进行预测?
无论哪种情况,在我看来固定效果线性模型都可能更合适。确实,如果我的理解是正确的,那么如果预测中未使用随机效应,则固定效应模型应预测与混合模型相同的值。应该是这样吗?在R
它不是,例如:
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject
产生不同的结果以:
mod2 <- lm(weight ~ height + age, data=df)
predict(mod2,newdata=newdf) # newdf columns for height, age