您为什么要从混合效应模型中进行预测,而又不包括随机效应呢?


10

这更多是一个概念性问题,但是在我使用时,R我将参考中的软件包R。如果目的是为了进行预测而拟合线性模型,然后在可能无法获得随机效应的情况下进行预测,那么使用混合效应模型有什么好处,还是应该使用固定效应模型?

例如,如果我有重量与高度数据以及其他一些信息,并且使用构建以下模型lme4,其中受试者是具有因子水平(Ñ = Ñ Ö 小号p Ë 小号ññ=ñØs一个pËs):

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

然后,我希望能够使用新的身高和年龄数据从模型中预测体重。显然,原始数据的个体差异是在模型中捕获的,但是可以在预测中使用此信息吗?假设我有一些新的身高和年龄数据,并且想要预测体重,我可以这样做:

predict(mod1,newdata=newdf) # newdf columns for height, age, subject

这将使用predict.merMod,并且我可以在newdf或set中为(新)主题添加一列re.form =~0。在第一种情况下,尚不清楚模型如何处理“新”主观因素,在第二种情况下,是否会简单地忽略(平均)模型中捕获的个体差异以进行预测?

无论哪种情况,在我看来固定效果线性模型都可能更合适。确实,如果我的理解是正确的,那么如果预测中未使用随机效应,则固定效应模型应预测与混合模型相同的值。应该是这样吗?在R它不是,例如:

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject

产生不同的结果以:

mod2 <- lm(weight ~ height + age, data=df)

predict(mod2,newdata=newdf) # newdf columns for height, age



1
您可能希望对未包含在估算中的新人群进行预测
kjetil b halvorsen

是的,但是在那种情况下,为什么还要打个混合效果模型呢?如果您忽略了预测中的随机效应,那么固定效应模型却没有给您带来什么呢?
tribalsoul

1
好吧,它可能会提供更好的估计,因为您有一个更好(更正确)的错误结构模型
kjetil b halvorsen

Answers:


5

简单思考实验:您测量了5个婴儿出生后的体重和身高。两年后,您再次从同一个婴儿那里进行了测量。同时,您几乎每周都要测量一下女儿的体重和身高,从而为她找到100对价值。如果使用混合效果模型,则没有问题。如果您使用固定效果模型,则会对女儿的测量结果施加过多的权重,如果仅使用她的数据,您将获得几乎相同的模型拟合度。因此,正确推断重复测量或不确定性结构不仅重要,而且对于预测也很重要。通常,从混合效果模型和固定效果模型(带有违背的假设)中,您不会获得相同的预测。

我可以在newdf中为(新)主题添加一列

您无法预测不属于原始(培训)数据的主题。再次进行思想实验:新主题是肥胖。模型如何知道它在随机效应分布的高端?

在模型中捕获的副主题方差将仅被忽略(平均)以进行预测

如果我对您的理解正确,那么可以。该模型为您提供了总体预期值的估计值(请注意,该估计值仍以原始主题为条件)。


1
谢谢您的清晰说明和示例,这一切都是有道理的。但是,您声明的位置You can't predict for subjects which were not part of the original (training) data;不能re.form=~0根据总体期望值进行设置和预测,让我做到这一点吗?诚然,该模型在预测中没有使用任何特定于对象的信息,但是可以说,混合效果模型的估计仍将比等效固定效果模型的估计更准确,在等效模型中,特定主题的变化为忽略了吗?
tribalsoul '17

1
固定模型不适用,因为违反了其假设。您必须使用包含依赖性结构的模型。re.form=~0为您提供人口水平的预测,这是您对新学科所做的最好的预测。
罗兰

glmmLasso 在R中使用该程序包时,我也有同样的问题。程序包的作者Andreas Groll表示,glmmLasso过程仅使用固定效果来预测新主题,而在下一个时间段中使用固定+随机效果来对现有主题进行预测。
RobertF
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.