使用Nakagawa&Schielzeth(2013)R2glmm方法在混合模型中计算


13

我一直在阅读有关在混合模型中计算值的信息,在阅读了R-sig常见问题解答之后,该论坛上的其他帖子(我会链接一些但我没有足够的声誉)以及其他一些参考资料,我知道使用在混合模型的上下文中,值很复杂。R2R2

但是,我最近在下面看到了这两篇论文。尽管这些方法对我来说确实很有希望,但我不是统计学家,因此我想知道其他人是否会对他们提出的方法以及与其他提出的方法进行比较有任何见解。

Nakagawa,Shinichi和Holger Schielzeth。“从广义线性混合效应模型获得R2的通用且简单的方法。” 《生态与进化中的方法》 4.2(2013):133-142。

约翰逊,保罗CD。“将Nakagawa&Schielzeth的R2GLMM扩展到随机斜率模型。” 《生态与进化中的方法》(2014年)。

也可以使用MuMIn包中的r.squaredGLMM函数来实现is方法,该方法提供了对该方法的以下描述。

对于混合效应模型,可以分为两种类型。边际代表用固定因子解释的方差,并定义为: 条件R ^ 2被解释为由固定和随机因素(即整个模型)解释的方差,并根据以下公式计算: R_ {GLMM}(c)^ 2 = \ frac {(σ_f ^ 2 + \ sum(σ_l^ 2))} {(σ_f^ 2 + \ sum(σ_l^ 2)+σ_e^ 2 +σ_d^ 2} 其中σ_f^ 2是固定效应分量的方差,并且\ sum (σ_l^ 2)是所有方差分量(组,个体等)的总和,σ_l^ 2R2R2

RGLMM(m)2=σf2σf2+(σl2)+σe2+σd2
R2
RGLMM(c)2=(σf2+(σl2))(σf2+(σl2)+σe2+σd2
σf2(σl2)σl2是由于添加剂分散引起的方差,而σd2是特定于分布的方差。

在分析中,我查看的是纵向数据,并且我主要对模型中固定效应所解释的方差感兴趣

library(MuMIn) 
library(lme4)

fm1 <- lmer(zglobcog ~ age_c + gender_R2 + ibphdtdep + iyeareducc + apoegeno + age_c*apoegeno + (age_c | pathid), data = dat, REML = FALSE, control = lmerControl(optimizer = "Nelder_Mead"))

# Jarret Byrnes (correlation between the fitted and the observed values)
r2.corr.mer <- function(m) {
   lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
   summary(lmfit)$r.squared
}

r2.corr.mer(fm1)
[1] 0.8857005

# Xu 2003
1-var(residuals(fm1))/(var(model.response(model.frame(fm1))))
[1] 0.8783479

# Nakagawa & Schielzeth's (2013)
r.squaredGLMM(fm1)
      R2m       R2c 
0.1778225 0.8099395 

我已经编辑您的帖子以使用mathjax格式。请仔细检查我是否没有意外引入任何错误。
Sycorax说恢复Monica 2014年

据我了解,您的问题缺少一个真实的问题。你能澄清你想要什么吗?推荐使用什么?
亨里克

@Henrik,您好,我对如何使用的建议很感兴趣,是的,但是更广泛地讲,不同的方法之间如何比较以及有什么不同。
2014年

我相信原来的方程式是错误的。这不是由于@ user777的更改。右边的两个术语应在分母中。看到这个
西里尔

该错误很可能是由于MuMIn软件包文档缺少括号引起的
Cyrille

Answers:


11

我是在2014年12月17日将道格拉斯·贝茨(Douglas Bates)的答复粘贴在R-Sig-ME邮件列表中的,以回答如何为广义线性混合模型计算统计信息的问题,我相信有兴趣的人都必须阅读该问题这样的事情。Bates是R软件包的原始作者,也是R软件包的合著者,也是一本有关混合模型的著名书籍的合著者,CV将从文本中获得答案,而不仅仅是从链接获得收益。它。R2lme4nlme

我必须承认,当人们谈论“用于GLMM的R2”时,会有些抽搐。线性模型的R2定义明确,并具有许多理想的属性。对于其他模型,可以定义不同的数量,这些数量反映了部分但并非全部这些属性。但这并不是从获得具有线性模型R2所具有的所有属性的数字的意义上计算R2。通常,可以使用几种不同的方式来定义此数量。特别是对于GLM和GLMM,在定义“已解释的响应方差比例”之前,首先需要定义“响应方差”的含义。

混淆R2的含义或与线性模型关联的其他任何线性量的自由度(应用于其他模型)的混淆来自公式与概念的混淆。尽管公式是从模型中得出的,但推导过程通常涉及相当复杂的数学。为了避免可能引起混淆的推导,而只是“切入正题”,更容易给出公式。但是公式不是概念。概括公式并不等同于概括概念。这些公式在实践中几乎从未使用过,特别是对于广义线性模型,方差和随机效应的分析。我有一个“元定理”,根据介绍性文字中给出的公式实际计算出的唯一数量就是样本均值。

对此,我似乎是个脾气暴躁的老头,也许是,但是危险是人们期望“ R2类”量具有线性模型中R2的所有特性。不可以 无法将所有属性归纳为一个更复杂的模型(如GLMM)。

我曾经在委员会上审查博士学位论文的建议。候选人资格。该提议是要检查我认为的9种不同公式,这些公式可以视为计算非线性回归模型的R2的方法,以确定哪个是“最佳”的。当然,这可以通过仅具有几个不同模型的模拟研究来完成,每个模型只有几个不同的参数值集。我关于这完全是毫无意义的练习的建议没有得到热烈欢迎。


10

浏览了文献之后,我发现以下论文比较了几种用于计算混合模型的值的不同方法,其中(MVP)方法等效于Nakagawa和Schielzeth提出的方法。R2R2

  • Lahuis,D等人(2014)多层次模型的方差解释。组织研究方法。

在此处输入图片说明

总体而言,大多数度量(公式,公式,(OLS)和(MVP))在所有条件和模型下均显示出可接受的偏差,一致性和效率水平。此外,这些措施的平均偏差值差异很小。在随机截距模型中,公式和公式的偏差最小,而在随机斜率模型中,公式和(MVP)的偏差最小。在效率方面,公式和(MVP)在随机截距模型中具有最低的标准偏差值。在随机斜率模型中,(MVP)和(OLS)的标准偏差最低。通常,公式不是有效的估算器。R2R2R2R2R2R2

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.