多层次建模的符号


10

一个需要指定用于训练多层模型(lmerlme4 R库中使用)的公式总是能帮助我。我读了无数的教科书和教程,但从未正确地理解它。

因此,这是本教程中的一个示例,我希望看到公式中的公式。我们正在尝试根据不同的情景将语音频率建模为性别(女性的声音比男性普遍高)和人的态度(无论他/她以礼貌还是非正式的方式回答)的函数。同样,从subject专栏中您可以看到,每个人都经过多次测量。

> head(politeness, n=20)
   subject gender scenario attitude frequency
1       F1      F        1      pol     213.3
2       F1      F        1      inf     204.5
3       F1      F        2      pol     285.1
4       F1      F        2      inf     259.7
5       F1      F        3      pol     203.9
6       F1      F        3      inf     286.9
7       F1      F        4      pol     250.8
8       F1      F        4      inf     276.8
9       F1      F        5      pol     231.9
10      F1      F        5      inf     252.4
11      F1      F        6      pol     181.2
12      F1      F        6      inf     230.7
13      F1      F        7      inf     216.5
14      F1      F        7      pol     154.8
15      F3      F        1      pol     229.7
16      F3      F        1      inf     237.3
17      F3      F        2      pol     236.8
18      F3      F        2      inf     251.0
19      F3      F        3      pol     267.0
20      F3      F        3      inf     266.0

subjectgenderattitude的因素(与informalfemale视为基础水平attitudegender在方程下文)。现在,一个想法是训练模式具有不同的每个拦截subjectscenario

politeness.model=lmer(frequency ~ attitude + gender + 
 (1|subject) + (1|scenario), data=politeness)

如果我对表示法的理解正确,则对应于:

yi=aj[i]1+ak[i]2+β attitudepoli+γ gendermalei

其中,表示数据点,为表示组级别和为表示组级别为数据点。和是二进制指示符。iithj[i]subjectk[i]scenarioithattitudepolgendermale

为了引入态度的随机斜率,我们可以这样写:

politeness.model = lmer(frequency ~ attitude + gender + 
 (1+attitude|subject) + (1+attitude|scenario), data=politeness)

同样,如果我的理解很清楚,则对应于:

yi=aj[i]1+ak[i]2+(βj[i]1+βk[i]2) attitudepoli+γ gendermalei

现在,以下R命令对应什么方程式?

politeness.null = lmer(frequency ~ gender +
 (1+attitude|subject) +  (1+attitude|scenario), data=politeness)

1
不是一个很明智的人;相对于态度,人口平均坡度假定为零...
Ben Bolker 2014年

@BenBolker:嘿,你能不能用等式形式写出来?我以前的方程式正确吗?在上一个模型中,我仍然看到attitudesubject和为条件scenario
abhinavkulkarni 2014年

Answers:


12

我会写

~ attitude + gender + (1|subject) + (1|scenario)

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b2,k[i]+ϵib1N(0,σ12)b2N(0,σ22)ϵN(0,σr2)
,其中表示固定效果系数,表示随机变量,是指标函数(这与您上面所说的基本相同,只是符号略有不同)。βbI
~ attitude + gender + (1+attitude|subject) + (1+attitude|scenario)

添加对象间的差异以响应attitudescenario(我们可以将随机效果部分等效地写为(attitude|subject) + (attitude|scenario),即隐式保留截距;这是一种品味问题)。现在

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b3,j[i]I(attitude=pol)+b2,k[i]+b4,k[i]I(attitude=pol)+ϵi{b1,b3}MVN(0,Σ1){b2,b4}MVN(0,Σ2)ϵN(0,σr2)
其中和是非结构化方差-协方差矩阵,即它们对称且为正(半)确定,但没有其他限制: ,对于同样。Σ1Σ2
Σ1=(σ12σ13σ13σ32)
Σ2

对术语进行如下分组可能是有启发性的: 因此您可以看到哪些随机效应正在影响截距,哪些正在影响姿态响应。

yi(β0+b1,j[i]+b2,k[i])+(β1+b3,j[i]+b4,k[i])I(attitude=pol)+β2I(gender=male)+ϵi

现在,如果您忽略固定效应attitude项(即,设置或从公式中删除该项),您将看到(无需重写所有内容),因为假定随机效应的均值为零,我们将假设在主题和场景之间对态度的平均响应将完全为零,而主题和场景之间仍然存在差异。从统计的角度来看,我不会说这绝对没有道理,但很少这样做。有时会在r-sig-mixed-models@r-project.org邮件列表中讨论此问题...(或者可以在StackExchange上进行讨论-如果没有,它将很好地跟进。 SE问题...)β1=0attitude

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.