如何在广义线性混合模型中解释随机效应的方差


9

在逻辑广义线性混合模型(家庭=二项式)中,我不知道如何解释随机效应方差:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

我如何解释这个数值结果?

我在一项多中心研究中有一个肾移植患者的样本。我正在测试各中心接受特定抗高血压治疗的患者的机率是否相同。各中心之间接受治疗的患者比例差异很大,但这可能是由于患者基础特征的差异所致。因此,我估算了一个广义线性混合模型(逻辑模型),并调整了患者的主要特征。结果如下:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

定量变量居中。我知道截距的医院间标准差为0.6554(以对数为单位)。由于截距为-1.804469(以对数为单位),因此对于一个“平均”中心,接受平均年龄,所有变量均值均平均值和免疫治疗A的男性降压治疗的可能性为14.1% 。现在开始进行解释:在随机效应遵循正态分布的假设下,我们预计大约95%的中心的值在均值零的2个标准偏差内,因此对平均水平的人进行治疗的可能性各中心之间的覆盖间隔为:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

它是否正确?

另外,如果中心之间的变异性在统计上显着,我该如何一目了然?我曾经与Donald Hedeker的出色软件MIXNO一起工作,而且我有一个估计方差的标准误差,这是我所没有的。我如何有机会以一个置信区间为每个中心的“普通”男人接受治疗?

谢谢

Answers:


10

如果您向我们显示有关模型的更多信息,这可能是最有用的,但是:无论医院做出何种反应(例如死亡率),对数奇数的基线值都会有所不同。基线值(按医院截取项)是基线类别(例如“未治疗”)中死亡率(或其他)的对数-奇数,任何连续预测变量的值为零。假定该变化是对数标度的正态分布。截距的医院间标准差为0.6554;方差(仅是标准偏差的平方- 而不是标准偏差的不确定性的量度)为。0.65542=0.4295

(如果您澄清问题/添加有关模型的更多详细信息,我可以尝试说更多。)

更新:您对变化的解释似乎是正确的。更确切地说,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

应该为您在整个医院接受治疗的基线个体(男性/平均年龄等)的概率提供95%的间隔(不是非常可信,但是非常相似)。

要测试随机效应的显着性,可以有多种选择(有关更多信息,请参见http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html)。(请注意,RE方差的标准误差通常不是检验显着性的可靠方法,因为采样分布通常是偏斜/非正态的。)最简单的方法是进行似然比检验,例如

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

最终的2分法纠正了以下事实:当零值(即RE方差= 0)在可行空间的边界上(即RE方差不能小于0)时,似然比检验是保守的。


我编辑了问题
user2310909 2014年

1
谢谢,很高兴与熟悉此主题的人一起阅读。
user2310909 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.