有关如何在lmer中指定随机效应的问题


55

我最近通过测量在不同上下文中查看该单词时的ERP(EEG),测量了在反复暴露(练习:第1天到第10天)时如何获取一个新单词的含义。我还控制了上下文的属性,例如,它对发现新词义(高或低)的有用性。我对练习的效果(天)特别感兴趣。由于单独的ERP记录比较嘈杂,因此可以通过对特定条件的试验求平均值来获得ERP组件值。通过该lmer函数,我应用了以下公式:

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

在文献中,我还看到了以下等效随机效应:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

使用以下形式的随机因子可以完成什么工作participants:context?是否有一个很好的资源可以让对矩阵代数仅有粗略了解的人准确地了解线性混合模型中的随机因素是什么以及应该如何选择它们?

Answers:


77

我将描述您每次调用lmer()拟合的模型以及它们的不同之处,然后回答有关选择随机效果的最终问题。

您的三个模型中的每个模型都包含的固定效果practicecontext以及两者之间的相互作用。模型之间的随机效应不同。

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

包含由的相同值的个人共享的随机截距participants。也就是说,每个participant回归线的上移/下移均值为的随机量。0

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

除随机截距外,此模型还包含的随机斜率practice。这意味着个人从实践中学习的速度因人而异。如果一个人具有积极的随机效应,那么他们在实践中的学习速度会比平均水平更快,而负面的随机效应则表明他们在实践中学习的速度比平均值要慢,或者随着实践的发展而变差,这取决于随机性的方差效果(这是假设练习的固定效果为正)。

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

与先前的模型一样,该模型适合于随机斜率和截距practice(您必须执行(practice-1|...)抑制截距的操作),但是现在您还在factor中添加了随机斜率和截距participants:context,这是一个新的因子,其水平存在于水平的每个组合participantscontext和相应的随机效应是由具有两个相同的值的观测共享participantscontext。为了适应这种模式,你需要有多种意见,即具有相同的值都participantscontext否则该模型是不可估计的。在许多情况下,此交互变量创建的组非常稀疏,导致噪声/难以拟合随机效应模型,因此在将交互因子用作分组变量时要格外小心。

基本上(阅读:不要太复杂),当您认为分组变量定义了数据集中的不均匀性“口袋”,或者共享分组因子水平的个人应该相互关联时(互不相关的个​​体)-随机效应可达到此目的。如果您认为两者共享水平participants并且context比这两个部分的总和更相似的观察结果,则包括“相互作用”随机效应可能是合适的。

编辑:正如@Henrik在评论中提到的,您适合的模型,例如:

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)

使得随机斜率和随机截距彼此相关,并且该相关性由模型估计。为了限制模型,使随机斜率和随机截距不相关(因此是独立的,因为它们是正态分布的),您可以拟合模型:

lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants), 
     data=base)

两者之间的选择应基于您是否认为,例如,participant基线高于平均值(即正随机截距)的s的变化率也可能高于平均值(即正随机斜率)。如果是这样,则应允许两者相互关联,否则,则应将它们约束为独立的。(同样,此示例假定固定效果斜率为正)。


2
我不想挑剔,但第二个模型也不包含截距和斜率之间的相关性。仅添加斜坡应该是:lmer(ERPindex ~ practice*context + (1|participants) + (0 + practice|participants, data=base)还是我错了?(不相关:打扰您对我的帖子做些小的修改。如果您不同意澄清,请改回来)
Henrik

@Henrik,是的,您是对的,它也可以估计两个随机效应之间的相关性。在写这个答案时,我试图给出这些模型正在发生什么的“大图”概念,其中不包括提及随机效应之间的相关性,而没有简单的“两分钱”描述。斜率和截距的方式:)无论如何,我认为这种疏忽不会使我在答案中所做的解释不正确。顺便说一句,谢谢你的编辑。
2012年

1
@Henrik,我添加了一条注释,说明使随机效应具有相关性和不相关性之间的区别,我认为它可以改善答案-感谢您指出这一点。
2012年

谢谢。我正在尝试研究混合建模问题,并且还在为如何以及何时使用哪种随机效果结构而苦苦挣扎,我只是想确保这一点。总而言之,很好的答案(+1)。
亨里克(Henrik)2012年

1
@pom,谢谢你的夸奖。回复:您的评论,我已经在模拟数据上对此进行了测试,但我认为您对此有反感。我正在编辑的第二个模型的参数比第一个少。这是因为第二个模型将两个随机效应之间的相关性约束为零。除此之外,型号相同。我不确定您遇到了什么,但是可复制的示例会有所帮助。这是我的:x <-rnorm(1000); id <- rep(1:100,each=10); y <- rnorm(1000); g <- lmer(y ~ (1+x|id)); g2 <- lmer(y ~ (1|id) + (x-1|id)); attr(logLik(g),"df"); attr(logLik(g2),"df");
2013年

13

@Macro在这里给出了一个很好的答案,我只想补充一点。如果您遇到的某些人正在使用:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

我怀疑他们在犯错。考虑:(practice|participants)表示practice对每种效果都有一个随机斜率(和截距)participant,而(practice|participants:context)意味着practice对每种participant by context 组合都有一个随机斜率(和截距)。这是好的,如果这就是他们想要的东西,但我怀疑他们想(practice:context|participants),这意味着有一个随机斜率(和截距)的相互作用影响practice by context每一个participant


4

在随机效应或混合效应模型中,当您想要将观察到的效应视为从某种效应的概率分布中提取时,便会使用随机效应。

我可以举的最好的例子之一是在多中心临床试验中对临床试验数据建模。站点效应通常被建模为随机效应。这样做是因为在试验中实际使用的20个左右站点是从更大的一组潜在站点中提取的。在实践中,选择可能不是随机的,但将其视为似乎仍然有用。

尽管可以将位点效应建模为固定效应,但是如果我们不考虑选择的20个不同位点集的效应会有所不同的事实,则很难将结果推广到更大的人群。将其视为随机效应可以使我们以这种方式进行解释。


1
-1,因为此答案此处未解决实际问题。
变形虫说恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.