允许比较混合效应模型(主要是随机效应)


20

我一直在研究使用R中的lme4包进行的混合效果建模。我主要使用该lmer命令,因此我将通过使用该语法的代码提出问题。我想可能是一个简单的普遍问题,可以比较lmer使用基于相同数据集的似然比构造的任何两个模型吗?我相信答案必须是“否”,但我可能是错误的。我已经阅读了有关随机效应是否必须相同的信息,而随机效应的含义是什么呢?因此,我将举几个例子。我将从使用单词刺激的重复测量数据中获取它们,也许像Baayen(2008)这样的东西在解释中会很有用。

假设我有一个模型,其中有两个固定效果预测变量,我们将它们称为A和B,还有一些随机效果……感知它们的单词和主题。我可能会构建如下模型。

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(请注意,我故意data =将其排除在外,REML = FALSE为了清晰起见,我们假设我的意思总是)

现在,以下模型中,哪些可以与上述模型的似然比进行比较,哪些不可以?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

我承认,对其中一些差异的解释可能是困难的,或者是不可能的。但是,让我们搁置一秒钟。我只想知道此处的更改是否存在某些根本性因素,从而无法进行比较。我还想知道是否LR比较合适,以及AIC比较。



(我注意到您删除了我之前添加的[hypothethesis-testing]标签。嗯,取决于您,但我认为这是适当的:似然比检验显然是一个假设检验程序,并且[mixed-model] + [hypothesis-testing ]恕我直言,是一个信息标记组合,请参阅stats.stackexchange.com/questions/tagged/...
阿米巴恢复莫妮卡说,

编辑以从LR中删除“测试”。LR无需测试即可进行解释,这使其与AIC更加平行,并且更好地遵循了我的真实意图。感谢您指出了这一点。
约翰(John John)

Answers:


13

使用最大可能性,可以将其中任何一个与AIC进行比较;如果固定效果是相同的(m1m4),即使用REML或ML是好的,与REML通常优选的,但如果它们是不同的,仅可以使用ML。但是,当固定效应和随机效应都改变时,通常很难解释,因此在实践中,大多数人建议一次只改变一个或另一个。

使用似然比检验是可能的,但很麻烦,因为在检验方差分量是否为零时,通常的卡方逼近不成立。有关详细信息,请参见Aniko的答案。(对Aniko表示感谢,他比我更仔细地阅读了问题,并认真阅读了我的原始答案,以至于发现它错过了这一点。谢谢!)

Pinhiero / Bates是经典参考书;它描述了nlme程序包,但是原理是相同的。好吧,大致相同;自从编写本书以来,道格·贝茨(Doug Bates)改变了他对推理的建议,新建议在lme4软件包中有所体现。但这不只是我想要进入的。更具可读性的参考文献是Weiss(2005),《纵向数据建模》。


模型m2和m4或m1和m3无法与似然比检验进行比较。它们不是嵌套模型。

糟糕,感谢您注意到@Macro!参见编辑。
亚伦-恢复莫妮卡

问题仅在于将模型与模型m进行比较,而不是相互比较。但是,尽管如此,您是否说即使没有嵌套也可以进行AIC比较?这个问题的答案似乎与此矛盾。
约翰

@John,我读了这些答案,但是错过了讨论AIC和非嵌套讨论的地方。我很确定这很好,但是您能否在答案中给我更准确的说明呢?
亚伦-恢复莫妮卡

我对答案不满意,因为您对似然比检验的适用性是错误的(或至少是误导性的)。
Aniko

12

您可以选择使用似然比检验评估当方差分量是否为0(要小心mVS m- m4),因为典型的卡方近似并不能适用。原因是原假设为,并且在参数空间的边界上,因此经典结果不适用。σ2=0

在这种情况下,有一个完整的LRT分布理论(例如,参见Self和Liang,1987 [1]),但是很快就变得混乱了。对于只有一个参数到达边界的特殊情况(例如mvs m2),似然比具有分布,这实际上意味着您必须将p减半基于。 χ 2 112χ12+12χ02χ12

但是,正如@Aaron所说,许多专家不建议像这样进行似然比测试。可能的替代方法是信息标准(AIC,BIC等)或引导LRT。

[1] Self,SG&Liang,K.在非标准条件下最大似然估计和似然比检验的渐近性质。统计员。协会,1987,82,605-610。


1
感谢您提供有关LR的信息。在为示例制作模型时,我并没有真正考虑过LR边界问题。我只是注意到您的答案尚不清楚,您的建议是否适用于简单情况,例如仅比较具有不同固定效果的模型(当然是估计的ML)。
约翰,

不,仅当测试方差分量时才会出现此问题,而不是固定效果。
亚伦-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.