REML vs ML stepAIC


10

在尝试研究如何进行混合模型分析并随后使用AIC选择最佳模型之后,我感到不知所措。我不认为我的数据那么复杂,但是我想确认自己所做的正确,然后就如何继续提供建议。我不确定我应该使用lme还是lmer,然后再使用这两个,如果我应该使用REML或ML。

我有一个选择值,我想知道哪个协变量最能影响该值并允许进行预测。这是一些组合的示例数据和我正在使用的测试代码:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

我有〜19个模型,这些模型使用各种组合和最多2种交互作用项来探索此数据,但始终以ID为随机效应,而comp1为我的因变量。

  • Q1。使用哪个?我还是我?有关系吗?

在这两种方法中,我都可以选择使用ML或REML-并且得到了截然不同的答案-使用ML再加上AIC,我最终得到了6个具有相似AIC值的模型,并且模型组合根本没有意义,而REML导致最有可能的两个模型是最好的。但是,在运行REML时,我无法再使用方差分析。

  • Q2。与ANOVA一起使用,是在ML之上使用ML的主要原因是什么?我不清楚。

我仍然无法运行stepAIC,或者我不知道缩小19种模型的其他方法。

  • Q3。目前有没有办法使用stepAIC?

3
对于第二季度,ML是必需的,因为当固定效果发生变化时,使用REML进行的比较无效。一个可能有用的相关问题在这里:stats.stackexchange.com/a/16015/3601
亚伦离开堆栈溢出,

@Aaron我以前看过这个问题,但仍然感到困惑。仅当随机效果发生变化时才使用REML吗?我显然对ML vs REML不够了解。不过,谢谢,这有助于解决我的问题之一!
凯瑞2012年

对,那是正确的。比较模型时,仅当模型具有相同的固定效果时才应使用REML。答案在下面展开。
亚伦(Aaron)

Answers:


16

Q1。使用哪个?我还是我?有关系吗? 都可以。他们会给你同样的适合。 lme会为您提供p值,lmer但不会,但是那比我想要的要多。最著名的参考文献是Doug Bates 在此处发布R-help邮件列表的文章之一。

(注意:他们确实使用略有不同的算法,因此在某些计算上困难的情况下,一个或另一个可能会做得更好,但在实践中很少见,实际上,很可能指向某种模型错误指定。请参阅完全不同来自lmer()和lme()的结果。)

Q2。与ANOVA一起使用,是在ML之上使用ML的主要原因是什么?我不清楚。 ML是必需的,因为当固定效果发生变化时,使用REML进行的比较无效。一个可能有用的相关问题在这里:https : //stats.stackexchange.com/a/16015/3601。要在上面的评论中回答您的问题,是的,当比较模型时,仅当模型具有相同的固定效果时(即,仅随机效果发生变化时),才应使用REML。REML可能性取决于模型中的固定效应,因此如果固定效应发生变化,则不可比。不过,通常认为REML可以对随机效应提供更好的估计,因此通常的建议是使用REML拟合最佳模型,以进行最终推断和报告。

Q3。目前有没有办法使用stepAIC? 要比较适合您情况的19种型号,只需比较所有型号的AIC。完全没有理由使用逐步过程。如今,逐步过程通常被视为过时的,因为它们不能保证找到最佳模型,并且计算机可以轻松地比较许多模型。


1

在进一步的挖掘中,我还发现了这些资源,这些资源备份了亚伦提供的链接,对于像我这样刚起步的人来说是不错的阅读材料。在链接的章节http://lme4.r-forge.r-project.org/的例子检查出的幻灯片链接http://lme4.r-forge.r-project.org/slides/同一项目页面上。许多短期课程甚至都提供了示例R代码,这很有帮助。
博克博士的简短回答也是http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.