将混合模型(作为随机效应)与简单的线性模型(作为固定效应)进行比较


10

我正在完成对大量数据的一些分析。我想采用在工作的第一部分中使用的线性模型,并使用线性混合模型(LME)重新拟合它。除了将模型中使用的变量之一用作随机效应外,LME非常相似。该数据来自一小群受试者(约10个)中的许多观察值(> 1000),我知道,将受试者的效果建模为随机效果更好(这是我要转移的变量)。R代码如下所示:

my_modelB <- lm(formula = A ~ B + C + D)    
lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML')

一切运行正常,结果极为相似。如果我可以使用RLRsim或AIC / BIC之类的东西来比较这两种模型并确定最合适的模型,那就太好了。我的同事们不想举报LME,因为尽管我认为LME是更合适的模型,但是没有一种容易获得的选择“更好”的方法。有什么建议么?

Answers:


6

A ~ B + CDH0σ2=0χ2χ2

library(lme4)
my_modelB <- lm(formula = A ~ B + C)
lme_model <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
lrt.observed <- as.numeric(2*(logLik(lme_model) - logLik(my_modelB)))
nsim <- 999
lrt.sim <- numeric(nsim)
for (i in 1:nsim) {
    y <- unlist(simulate(mymodlB))
    nullmod <- lm(y ~ B + C)
    altmod <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
    lrt.sim[i] <- as.numeric(2*(logLik(altmod) - logLik(nullmod)))
}
mean(lrt.sim > lrt.observed) #pvalue

自举的LRT的比例比观察到的LRT的p值更为极端。


感谢您完成我的回答。同样,有时人们使用混合的卡方而不是卡方分布进行检验统计。
ocram 2011年

@ocram +1,供您决定是否将变量视为随机变量还是固定变量与分析分开对待。@MudPhud如果您的PI不理解问题并坚持使用p值,则可以只向他显示随机效果测试的结果(无论如何,您都应将其包括在文章中)。
2011年

感谢您的代码。当我跑了它的结果是没有自举LRTS的比观测到的更大,所以这意味着我可以坚持到LM没有抛出的随机效应,甚至原来的变量。
MudPhud

@MudPhud:您收到任何错误吗?尝试键入lrt.sim以确保它们都不是全零,在这种情况下,最可能的罪魁祸首是您没有安装该软件包lme4
锁定2011年

它们不是0,与观察到的(63.95)相比非常小(〜1e-6)。
MudPhud 2011年

2

0H0v一个[R一世一个ñCË=0H1个v一个[R一世一个ñCË>0...

编辑

为了避免混淆:有时使用上述测试来确定随机效果是否显着...而不是确定是否应将其转换为固定效果。


问题是:是否有测试来确定将变量建模为混合效应还是随机效应?否则,您可以执行您描述的测试,然后使用卡方dist进行测试(我不确定什么是合适的测试)。
MudPhud 2011年

2
@MudPhud:实际上应该在计划研究之前在分析之前确定将变量建模为固定效应还是随机效应。这尤其取决于您的结论范围。随机效应可提供更高的通用性。它还可以避免一些技术困难。例如,随着参数数量的增加,渐近性可能会崩溃,例如,将具有多个级别的分类变量视为固定变量时就是这种情况。
ocram 2011年

我同意,但是当我尝试向我的PI解释这一点时,他只是转过身,要求某种p值。我想将此分析包括在手稿中,但是如果没有更具体的理由,他不会将其放入。
MudPhud 2011年

1
@MudPhud:据我所知,这种决定没有p值。如果兴趣集中在所选特定级别的影响上,则应将其视为固定的。如果将可用因子水平视为来自较大人群的随机样本,并且希望针对较大人群进行推论,则效果应该是随机的。
ocram 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.