多层次建模的符号

一个需要指定用于训练多层模型（lmer从lme4 R库中使用）的公式总是能帮助我。我读了无数的教科书和教程，但从未正确地理解它。

因此，这是本教程中的一个示例，我希望看到公式中的公式。我们正在尝试根据不同的情景将语音频率建模为性别（女性的声音比男性普遍高）和人的态度（无论他/她以礼貌还是非正式的方式回答）的函数。同样，从subject专栏中您可以看到，每个人都经过多次测量。

> head(politeness, n=20)
   subject gender scenario attitude frequency
1       F1      F        1      pol     213.3
2       F1      F        1      inf     204.5
3       F1      F        2      pol     285.1
4       F1      F        2      inf     259.7
5       F1      F        3      pol     203.9
6       F1      F        3      inf     286.9
7       F1      F        4      pol     250.8
8       F1      F        4      inf     276.8
9       F1      F        5      pol     231.9
10      F1      F        5      inf     252.4
11      F1      F        6      pol     181.2
12      F1      F        6      inf     230.7
13      F1      F        7      inf     216.5
14      F1      F        7      pol     154.8
15      F3      F        1      pol     229.7
16      F3      F        1      inf     237.3
17      F3      F        2      pol     236.8
18      F3      F        2      inf     251.0
19      F3      F        3      pol     267.0
20      F3      F        3      inf     266.0

subject，gender和attitude的因素（与informal和female视为基础水平attitude和gender在方程下文）。现在，一个想法是训练模式具有不同的每个拦截subject和scenario：

politeness.model=lmer(frequency ~ attitude + gender + 
 (1|subject) + (1|scenario), data=politeness)

如果我对表示法的理解正确，则对应于：

$y_i=a^1_{j[i]}+a^2_{k[i]}+\beta\cdot$ attitude $_{\text{pol}_i} + \gamma\cdot$ gender $_{\text{male}_i}$

其中，表示数据点，为表示组级别和为表示组级别为数据点。和是二进制指示符。 $i$ $i^{th}$ $j[i]$ subject $k[i]$ scenario $i^{th}$ attitude $_\text{pol}$ gender $_\text{male}$

为了引入态度的随机斜率，我们可以这样写：

politeness.model = lmer(frequency ~ attitude + gender + 
 (1+attitude|subject) + (1+attitude|scenario), data=politeness)

同样，如果我的理解很清楚，则对应于：

$y_i = a^1_{j[i]} + a^2_{k[i]} + (\beta^1_{j[i]} + \beta^2_{k[i]})\cdot$ attitude $_{\text{pol}_i} + \gamma\cdot$ gender $_{\text{male}_i}$

现在，以下R命令对应什么方程式？

politeness.null = lmer(frequency ~ gender +
 (1+attitude|subject) +  (1+attitude|scenario), data=politeness)

r multilevel-analysis lme4-nlme

— Abhinavkulkarni
source

不是一个很明智的人；相对于态度，人口平均坡度假定为零...

— Ben Bolker 2014年

@BenBolker：嘿，你能不能用等式形式写出来？我以前的方程式正确吗？在上一个模型中，我仍然看到attitude以subject和为条件scenario。

— abhinavkulkarni 2014年

我会写

~ attitude + gender + (1|subject) + (1|scenario)

如

y_{i} \sim β_{0} + β_{1} \cdot I (attitude = pol) + β_{2} I (gender = male) + b_{1, j [i]} + b_{2, k [i]} + ϵ_{i} b_{1} \sim N (0, σ_{1}^{2}) b_{2} \sim N (0, σ_{2}^{2}) ϵ \sim N (0, σ_{r}^{2})

$y_i \sim \beta_0 + \beta_1 \cdot I(\textrm{attitude}=\textrm{pol}) + \beta_2 I(\textrm{gender}=\textrm{male}) + b_{1,j[i]} + b_{2,k[i]} + \epsilon_i \\ b_1 \sim N(0,\sigma^2_1) \\ b_2 \sim N(0,\sigma^2_2) \\ \epsilon \sim N(0,\sigma^2_r)$ ，其中表示固定效果系数，表示随机变量，是指标函数（这与您上面所说的基本相同，只是符号略有不同）。

β

$\beta$

b

$b$

I

$I$

~ attitude + gender + (1+attitude|subject) + (1+attitude|scenario)

添加对象间的差异以响应attitude和scenario（我们可以将随机效果部分等效地写为(attitude|subject) + (attitude|scenario)，即隐式保留截距；这是一种品味问题）。现在

y_{i} \sim β_{0} + β_{1} \cdot I (attitude = pol) + β_{2} I (gender = male) + b_{1, j [i]} + b_{3, j [i]} I (attitude = pol) + b_{2, k [i]} + b_{4, k [i]} I (attitude = pol) + ϵ_{i} {b_{1}, b_{3}} \sim MVN (0, Σ_{1}) {b_{2}, b_{4}} \sim MVN (0, Σ_{2}) ϵ \sim N (0, σ_{r}^{2})

$y_i \sim \beta_0 + \beta_1 \cdot I(\textrm{attitude}=\textrm{pol}) + \beta_2 I(\textrm{gender}=\textrm{male}) + \\ b_{1,j[i]} + b_{3,j[i]} I(\textrm{attitude}=\textrm{pol}) + b_{2,k[i]} + b_{4,k[i]} I(\textrm{attitude}=\textrm{pol}) + \epsilon_i \\ \{b_1,b_3\} \sim \textrm{MVN}({\mathbf 0},\Sigma_1) \\ \{b_2,b_4\} \sim \textrm{MVN}({\mathbf 0},\Sigma_2) \\ \epsilon \sim N(0,\sigma^2_r)$ 其中和是非结构化方差-协方差矩阵，即它们对称且为正（半）确定，但没有其他限制：，对于同样。

Σ_{1}

$\Sigma_1$

Σ_{2}

$\Sigma_2$

Σ_{1} = (\begin{array}{cc} σ_{1}^{2} & σ_{13} \\ σ_{13} & σ_{3}^{2} \end{array})

$\Sigma_1 = \left( \begin{array}{cc} \sigma^2_1 & \sigma_{13} \\ \sigma_{13} & \sigma^2_3 \end{array} \right)$

Σ_{2}

$\Sigma_2$

对术语进行如下分组可能是有启发性的：因此您可以看到哪些随机效应正在影响截距，哪些正在影响姿态响应。

y_{i} \sim (β_{0} + b_{1, j [i]} + b_{2, k [i]}) + (β_{1} + b_{3, j [i]} + b_{4, k [i]}) \cdot I (attitude = pol) + β_{2} I (gender = male) + ϵ_{i}

$y_i \sim (\beta_0 + b_{1,j[i]} + b_{2,k[i]}) + \\ ( \beta_1 + b_{3,j[i]} + b_{4,k[i]}) \cdot I(\textrm{attitude}=\textrm{pol}) + \beta_2 I(\textrm{gender}=\textrm{male}) + \epsilon_i$

现在，如果您忽略固定效应attitude项（即，设置或从公式中删除该项），您将看到（无需重写所有内容），因为假定随机效应的均值为零，我们将假设在主题和场景之间对态度的平均响应将完全为零，而主题和场景之间仍然存在差异。从统计的角度来看，我不会说这绝对没有道理，但很少这样做。有时会在r-sig-mixed-models@r-project.org邮件列表中讨论此问题...（或者可以在StackExchange上进行讨论-如果没有，它将很好地跟进。 SE问题...） $\beta_1=0$ attitude

— 本·博克
source