解释glmer中的随机效应方差


13

我正在修订有关授粉的论文,其中数据按二项分布(水果成熟或没有成熟)。因此,我使用glmer了一种随机效果(单个植物)和一种固定效果(治疗)。审稿人想知道植物是否对坐果有影响-但我在解释glmer结果时遇到困难。

我已经在网络上阅读过,似乎直接比较glmglmer模型可能存在问题,所以我没有这样做。我认为回答这个问题的最直接方法是将随机效应方差(下面的1.449)与总方差进行比较,或者将处理结果解释为方差。但是,如何计算这些其他方差?它们似乎未包含在下面的输出中。我读到一些关于二项式不包括残差的信息glmer-我如何解释随机效应的相对重要性?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

Answers:


12

虽然原则上可以为GLMM 获得“每种效应所解释的比例方差”的类似物,但有几个复杂因素(您将模型的哪个级别视为“总方差”,以及如何量化由于最低级别(在这种情况下为二项式)采样分布)? Nakagawa和Schielzeth(doi:10.1111 / j.2041-210x.2012.00261.x)提出了一种计算(G)LMM的R ^ 2(解释了总方差的比例)的通用方法,该方法在生态学中非常流行。Xu等2003采取类似的方法。原则上,可以将此方法扩展为考虑用不同术语解释的方差比例[但请注意,以这种方式考虑的模型中所有术语的“方差比例”可能不会总计为100%,或多或少]。

但是,如果您的审阅者不愿透露统计细节,并且对“重要性”的启发式解释感到满意,则可以指出,估计的工厂间标准差为1.20,非常接近最大的标准差。治疗效果(-1.18);这意味着植物有很大不同,相对于治疗影响的程度(例如,的植物效应的95%的范围是约,从到)。- 1.96 σ +4σ1.96σ+1.96σ

视觉上:

在此处输入图片说明


+1,我对您(我认为是对非线性模型的提及)很感兴趣。您对此处的讨论有何看法:应报告哪种logistic R2伪逻辑回归(Cox&Snell或Nagelkerke)?R2
gung-恢复莫妮卡

1
我只是说我不认为这是一个疯狂的问题,也不一定是病态的问题。但是,无论是层次结构还是类似GLM的模型都打开蠕虫的罐头,这使得选择答案更加困难。我通常不会打扰,但我可以理解为什么人们想要尝试找到一种以合理的方式衡量适合度或项在模型中的相对重要性的数字。
本·博克

那是合理的。顺便说一句,您如何看待我的建议,即使用10种植物,3种处理方法且N = 30,OP可以同时使用这两种模型作为固定效应?当然,我不一定认为这将是正确的最终模型,但这确实使我感到惊讶,因为它是测试植物之间是否存在变异以及将两个变量放在相似的立足点进行比较的潜在允许方式。
gung-恢复莫妮卡

对我来说似乎很合理。
本·博克

我按照gung提出的方法,将“治疗”和“植物”作为固定效应进行拟合,并且“植物”项的p值非常高(p = 0.3)。就像您说的那样,考虑到“植物间标准偏差的估计值为1.20,非常接近最大治疗效果的幅度(​​-1.18)”,这似乎不奇怪吗?为什么在具有2种固定效果的方差分析中它显得微不足道?
jwb4

3

您要测试方差是否PlantID为。但是,这是尝试运行的怪异测试,因为空值位于允许空间的边界。这样的测试仍在运行,但是很多人对此感到非常不舒服。 0

对于您的情况,每个工厂有多个度量,因此一种快速而肮脏的方法是运行PlantID具有固定效果的模型,然后测试该效果。


1

对您的审阅者的简单答案是:“是”。如果他要您测试随机效应的方差是否显着不同于0,则有两种选择。请注意,尽管随机影响的方差是否不同于0,但许多聪明人对测试并不满意。

最简单的方法是似然比测试,尽管大多数人不建议这样做。在边界进行测试时,它们非常保守(即,您正在针对方差为0的情况进行测试,该方差尽可能小)。有一个经验法则是p值大约是实际值的两倍。

建议在大多数地方使用的方法是参数引导程序。您可以bootMerlme4包装中使用。确保将lmer函数的REML参数设置为FALSE,否则您的方差将大于0 100%的时间(或接近它的时间...实际上,它可能大于0的100%)无论如何)。

一些提示和更多资源:

http://glmm.wikidot.com/faq(找到“如何测试随机效果是否显着?标题”)

用于固定效果的lmer()参数引导测试

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/


感谢您提供清晰的模型提示(提示!)。但是我将如何解释随机变量影响的“幅度”?即,如何将我的随机变量解释的方差与固定变量解释的方差(治疗)进行比较?我想我看不到自举式LRT测试的结果是如何收集的。
jwb4

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.