从混合效应模型(lme4)中提取案例的斜率


13

我想在混合效果模型中提取每个人的斜率,如下段所述

混合效应模型被用来表征认知摘要测度中各个变化路径的特征,包括年龄,性别和受教育年限等术语作为固定效应(Laird and Ware,1982; Wilson et al。,2000,2002c)。在对年龄,性别和教育程度的影响进行调整后,从混合模型中提取了残差的个体认知下降斜率项。然后将特定于人的调整后的残留斜率用作遗传关联分析的定量结果表型。这些估计值等于个人的斜率与相同年龄,性别和受教育程度的个人的预测斜率之差。

De Jager,PL,Shulman,JM,Chibnik,LB,Keenan,BT,Raj,T.,Wilson,RS等。(2012)。全基因组扫描,寻找影响年龄相关的认知衰退率的常见变异。衰老的神经生物学,33(5),1017.e1-1017.e15。

我已经看过使用该coef函数提取每个人的系数,但是我不确定这是否是正确的方法。

谁能提供一些有关如何执行此操作的建议?

#example R code 
library(lme4)
attach(sleepstudy)  
fml <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)
beta <- coef(fml)$Subject
colnames(beta) <- c("Intercept", "Slope")
beta

summary(beta)
summary(fm1)

Answers:


29

该模型:

library(lme4)
data(sleepstudy)
fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)

该功能coef是提取个体差异的正确方法。

> coef(fm1)$Subject
    (Intercept)       Days
308    253.6637 19.6662581
309    211.0065  1.8475834
310    212.4449  5.0184067
330    275.0956  5.6529540
331    273.6653  7.3973908
332    260.4446 10.1951151
333    268.2455 10.2436611
334    244.1725 11.5418622
335    251.0714 -0.2848735
337    286.2955 19.0955694
349    226.1950 11.6407008
350    238.3351 17.0814915
351    255.9829  7.4520286
352    272.2687 14.0032989
369    254.6806 11.3395025
370    225.7922 15.2897513
371    252.2121  9.4791308
372    263.7196 11.7513155

这些值是固定效应和方差成分(随机效应)的组合。您可以使用summarycoef获得固定效果的系数。

> coef(summary(fm1))[ , "Estimate"]
(Intercept)        Days 
  251.40510    10.46729 

截距为251.4,斜率(与关联Days)为10.4。这些系数是所有主题的均值。要获得随机效果,可以使用ranef

> ranef(fm1)$Subject
    (Intercept)        Days
308   2.2585637   9.1989722
309 -40.3985802  -8.6197026
310 -38.9602496  -5.4488792
330  23.6905025  -4.8143320
331  22.2602062  -3.0698952
332   9.0395271  -0.2721709
333  16.8404333  -0.2236248
334  -7.2325803   1.0745763
335  -0.3336936 -10.7521594
337  34.8903534   8.6282835
349 -25.2101138   1.1734148
350 -13.0699598   6.6142055
351   4.5778364  -3.0152574
352  20.8635944   3.5360130
369   3.2754532   0.8722166
370 -25.6128737   4.8224653
371   0.8070401  -0.9881551
372  12.3145406   1.2840295

这些值是受试者的方差成分。每行对应一个主题。每列的平均值在本质上为零,因为这些值对应于与固定效果有关的差异。

> colMeans(ranef(fm1)$Subject)
  (Intercept)          Days 
 4.092529e-13 -2.000283e-13 

请注意,这些值等于零,偏差是由于浮点数表示形式的不精确造成的。

coef(fm1)$Subject固定效果合并为随机效果的结果,即,将固定效果系数添加到随机效果中。结果是各个截距和斜率。


感谢您的答复,这清除了如何计算各个系数。但是,还有一个问题,当上一段说他们对残差进行了调整时,这是否与将随机效应包括在系数中相同还是一个单独的问题?
2014年

您声明coef(summary(fm1))[,“ Estimate”]产生所有主题的平均值。我认为这意味着拦截是“ Reaction”的平均值,但是“ mean(sleepstudy $ Reaction)= 298.5079”。这是线性回归中截距的解释,我试图理解混合效果模型中的系数,并且在努力获得一些东西(像这样加起来)。为什么截距不是298.5?
svannoy

@svannoy注意,截距是所有协变量均等于零时因变量的估计值。此处,Days并非以平均值为中心,因此模型的截距低于的平均值Reaction。此外,回归线是最佳的线性拟合。因此,观察结果不一定在这条线上。
Sven Hohenstein

@SvenHohenstein感谢您澄清这一点。那么可以说在仅具有单个分类预测变量和偏差编码(contr.sum())的OLS回归中,截距恰好是均值;而在具有随机截距模型的RC回归中,截距是估计的均值吗?
svannoy

@svannoy是的,使用偏差编码时,截距反映了OLS回归中的均值。在线性混合模型中,截距确实是估计的均值。
Sven Hohenstein
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.