这个论坛上有很多讨论,涉及使用来指定各种层次模型的正确方法lmer
。
我认为将所有信息都放在一个地方会很棒。有几个问题要开始:
- 如何指定多个级别,其中一个组嵌套在另一个组中:是
(1|group1:group2)
还是(1+group1|group2)
? (~1 + ....)
和(1 | ...)
和(0 | ...)
等之间有什么区别?- 如何指定小组级别的互动?
lmer
具有普遍的统计意义,因此不仅是编程问题。因此,我投票保持该线程开放。
这个论坛上有很多讨论,涉及使用来指定各种层次模型的正确方法lmer
。
我认为将所有信息都放在一个地方会很棒。有几个问题要开始:
(1|group1:group2)
还是(1+group1|group2)
?(~1 + ....)
和(1 | ...)
和(0 | ...)
等之间有什么区别?lmer
具有普遍的统计意义,因此不仅是编程问题。因此,我投票保持该线程开放。
Answers:
(〜1 + ....)和(1 | ...)和(0 | ...)等之间有什么区别?
假设您有由分类变量V2预测的变量V1(将其视为随机效应)和由连续变量V3预测的线性固定效应。使用lmer语法,最简单的模型(M1)为:
V1 ~ (1|V2) + V3
该模型将估算:
P1:全局拦截
P2: V2的随机效应截距(即,对于V2的每个级别,该级别的截距与全局截距的偏差)
P3:对V3的效果(斜率)的单个全局估计
第二个最复杂的模型(M2)是:
V1 ~ (1|V2) + V3 + (0+V3|V2)
此模型从M1估计所有参数,但将另外估计:
P4: V2的每个级别内的V3效果(更具体地说,给定级别内的V3效果偏离V3的整体效果的程度),同时在跨级别的截距偏差和V3效果偏差之间实施零相关的V2。
在最终的最复杂模型(M3)中放宽了后一个限制:
V1 ~ (1+V3|V2) + V3
其中,在允许截距偏差和V3效果偏差在V2级别内相关的同时,估算M2的所有参数。因此,在M3中,估计了一个附加参数:
P5:在V2的各个级别上,截距偏差和V3偏差之间的相关性
通常计算模型对,例如M2和M3,然后进行比较以评估固定效应(包括全局截距)之间的相关性。
现在考虑添加另一个固定效果预测变量V4。该模型:
V1 ~ (1+V3*V4|V2) + V3*V4
估计:
P1:全局拦截
P2:对V3效果的单个全局估算
P3:对V4效果的单个全局估算
P4: V3和V4之间交互的单个全局估计
P5:在每个V2级别中,与P1截距的偏差
P6:在每个V2级别中,V3效果与P2的偏差
P7:在每个V2级别中,V4效果与P3的偏差
P8:在每个V2级别中,P3的V3-by-V4交互作用的偏差
V2级别上P5和P6之间的P9相关性
P10与V2级别之间的P5和P7之间的相关性
P11与V2级别之间的P5和P8之间的相关性
P12的相关性P6和P7跨越V2的水平
P13跨V2级别的P6和P8之间的相关性
P14的相关性P7和P8跨越V2的水平
哎呀,参数很多!而且,我什至不必列出该模型估算的方差参数。此外,如果您有一个类别变量要建模为固定效果,且具有两个以上级别,而不是该变量具有单个效果,则您将始终估计k-1个效果(其中k是级别数) ,从而进一步扩大了模型估计的参数数量。
lmer
Y~X+Z+(1|group)+(0+X|Z)
group
如另一个答案中所述,一般的技巧是公式遵循形式dependent ~ independent | grouping
。在grouping
通常是一个随机因子,可以包括固定要素,没有任何分组和可以有不带任何固定因子(截距-唯一模式)附加随机因素。甲+
因素之间表示没有相互作用,*
表明相互作用。
对于随机因素,您具有三个基本变体:
(1 | random.factor)
(0 + fixed.factor | random.factor)
(1 + fixed.factor | random.factor)
请注意,变量3具有在同一分组中(即同时)计算出的斜率和截距。如果我们要独立计算斜率和截距,即两者之间没有任何假定的相关性,则需要第四个变体:
(1 | random.factor) + (0 + fixed.factor | random.factor)
。编写此代码的另一种方法是使用双杠符号fixed.factor + (fixed.factor || random.factor)
。您应该看一下该问题的另一个答复中,有一个不错的摘要。
如果您想深入研究数学,Barr等人。(2013年)lmer
在他们的表1中很好地总结了语法,将其修改为满足无表减价的约束。该论文涉及心理语言学数据,因此两个随机效应为Subject
和Item
。
模型和等效lme4
公式语法:
Y ∼ X+(1∣Subject)
Y ∼ X+(1 + X∣Subject)
Y ∼ X+(1 + X∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
Y ∼ X+(0 + X∣Subject)+(1∣Item)
参考文献:
巴尔(Barr),戴尔(Dale J),里维(R.Levy),席普斯(C. 用于验证假设检验的随机效应结构:保持最大。记忆与语言杂志,68:255–278。
该|
符号表示混合方法中的分组因子。
根据Pinheiro和Bates:
...该公式还指定了响应,并且在可能的情况下指定了主协变量。给出为
response ~ primary | grouping
其中
response
是响应primary
的表达式,是主要协变量grouping
的表达式,并且是分组因子的表达式。
根据您在中执行混合方法分析所使用的方法R
,您可能需要创建一个groupedData
对象才能使用分析中的分组(nlme
有关详细信息,请参阅软件包,lme4
似乎不需要这样做)。我无法说出您指定lmer
模型语句的方式,因为我不知道您的数据。但是,(1|foo)
根据我所见,模型行中有多个是不寻常的。您想建模什么?
lme4