写出多层混合效应模型的数学方程

简历问题

我正在尝试给出混合效果模型的详细且简洁的数学表示。我lme4在R中使用该软件包。我的模型的正确数学表示是什么？

数据，科学问题和R代码

我的数据集由不同地区的物种组成。我正在测试某个物种的流行率是否在导致灭绝（灭绝不一定是永久性的；它可以重新定殖）或定居之后的时间内发生变化。

lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))

患病率是某个区域年份中某物种所占地层的比例
时间是一个连续变量，表示灭绝或定植的时间；它总是积极的
类型是具有两个级别的类别变量。这两个级别是“-”和“ +”。当type为-时，它是一个殖民化（默认级别）。当type为+时，表示灭绝。
Reg是具有9个级别的类别变量，表示区域
spp是分类变量；级别数因地区而异，在48级和144级之间变化。

换句话说：响应变量是患病率（占地层的比例）。固定效果包括1）和拦截，2）事件发生的时间以及3）事件发生的时间与事件类型（殖民化或灭绝）之间的相互作用。这3种固定效应中的每一种在区域之间随机变化。在一个区域内，每种效应在物种之间随机变化。

我试图弄清楚如何为模型编写数学方程式。我想我理解R代码中发生的事情（尽管，我确信我有一些知识空白，希望写出正式的数学表达式可以增进我的理解）。

我已经通过网络和这些论坛进行了很多搜索。可以肯定的是，我发现了大量有用的信息（也许我会在对此问题的编辑中链接到其中一些信息）。但是，我无法完全找到将R代码的“ Rosetta Stone”转换为数学公式（我对代码更满意）是否真的可以帮助我确认我正确理解了这些方程式。实际上，我知道已经存在一些差距，但是我们会解决的。

我的尝试

混合效应模型的基本形式，在矩阵表示法中为（我的理解）：

Y = X β + Z γ + ϵ

$Y = X \beta + Z \gamma + \epsilon$

X = [\begin{matrix} 1 & Δ t & Δ t_{+} \\ ⋮ & ⋮ & ⋮ \\ 1 & Δ t_{n} & Δ t_{+, n} \end{matrix}]

$X = \begin{bmatrix} 1 & \Delta t & \Delta t_{+} \\ \vdots & \vdots & \vdots \\ 1 & \Delta t_n & \Delta t_{+,n} \end{bmatrix}$

β^{^{'}} = [\begin{matrix} β_{0} & β_{1} & β_{2} \end{matrix}]

$\beta^{'} = \begin{bmatrix} \beta_0 & \beta_1 & \beta_2 \end{bmatrix}$

Z = [\begin{matrix} 1 I (r_{1}) & Δ t I (r_{1}) & Δ t_{+} I (r_{1}) & \dots & 1 I (r_{9}) & Δ t I (r_{9}) & Δ t_{+} I (r_{9}) \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ & ⋮ \\ 1 I (r_{1, n}) & Δ t_{n} I (r_{1, n}) & Δ t_{+, n} I (r_{1, n}) & \dots & 1 I (r_{9, n}) & Δ t I (r_{9, n}) & Δ t_{+, n} I (r_{9, n}) \end{matrix}]

$Z = \begin{bmatrix} 1 I(r_1) & \Delta t I(r_1) & \Delta t_{+} I(r_1) & \dots & 1 I(r_9) & \Delta t I(r_9) & \Delta t_{+} I(r_9) \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 1 I(r_{1,n}) & \Delta t_n I(r_{1,n}) & \Delta t_{+,n} I(r_{1,n}) & \dots & 1 I(r_{9,n}) & \Delta t I(r_{9,n}) & \Delta t_{+,n} I(r_{9,n}) \\ \end{bmatrix}$

γ^{^{'}} = [\begin{matrix} γ_{0, 1} & γ_{1, 1} & γ_{2, 1} & \dots & γ_{0, 9} & γ_{1, 9} & γ_{2, 9} \end{matrix}]

$\gamma^{'} = \begin{bmatrix} \gamma_{0,1} & \gamma_{1,1} &\gamma_{2,1} & \dots & \gamma_{0,9} & \gamma_{1,9} &\gamma_{2,9} \end{bmatrix}$

ϵ \sim N (0, Σ)

$\epsilon \sim \mathcal{N}(0,\Sigma)$

$X$ 是固定效果的设计矩阵，是定居后的时间（），是消灭后的时间（） $\Delta t$ time $\Delta t_{+}$ time:type
$Z$ 是随机效应的设计矩阵（级别1？），I（）是指标函数，如果样本属于指定区域，则给出1，否则，则给出0，将r索引以指示九个区域之一。
$\beta$ 和包含参数 $\gamma$
$\epsilon$ 是错误；我不确定如何解释，尽管我意识到这些方差/协方差矩阵之一将表示斜率和截距之间的协方差，例如 $\Sigma$

假设到目前为止一切正确，这意味着我在顶级水平上是不错的。但是，解释嵌套在每个区域中的参数的特定于物种的变化，让我更加难受。

但是我对可能有意义的事情有所了解...

每个参数均来自区域内特定物种的预测变量和参数的线性组合。对于每个区域，存在3行，分别对应于3个预测变量。每个可以分别表示为 $\gamma$ $\gamma$

- 其中是特定于区域的设计矩阵，而预测变量，是该区域的参数的1 x S矩阵（区域中的丰富度=，例如48或144），和是误差项的矩阵 $U_{p,r}$ $r$ $p$ $b_{p,r}$ $S$ $\eta_{p,r}$

具体来说，对于给定区域，每个将是： $\gamma_{p,r}$

γ_{0, r} = U_{0, r} b_{0, r} + η_{0, r}

$\gamma_{0,r} = U_{0,r} b_{0,r} + \eta_{0,r}$

γ_{0, r} = [\begin{matrix} 1 I (s_{1}) \dots 1 I (s_{S}) \end{matrix}] + [\begin{matrix} b_{0, 1} \\ ⋮ \\ b_{0, S} \end{matrix}] + η_{0, r}

$\gamma_{0,r} = \begin{bmatrix} 1 I(s_1) \dots 1 I(s_S) \end{bmatrix} + \begin{bmatrix} b_{0,1}\\ \vdots \\ b_{0,S} \end{bmatrix} + \eta_{0,r}$

γ_{1, r} = U_{1, r} b_{1, r} + η_{1, r}

$\gamma_{1,r} = U_{1,r} b_{1,r} + \eta_{1,r}$

γ_{1 ， [R} = [\begin{matrix} Δ Ť 一世 （ s_{1} ） \dots Δ Ť 一世 （ s_{小号} ） \end{matrix}] + [\begin{matrix} b_{1 ， 1} \\ ⋮ \\ b_{1 ， 小号} \end{matrix}] + η_{1 ， [R}

$\gamma_{1,r} = \begin{bmatrix} \Delta t I(s_1) \dots \Delta t I(s_S) \end{bmatrix} + \begin{bmatrix} b_{1,1}\\ \vdots \\ b_{1,S} \end{bmatrix} + \eta_{1,r}$

γ_{2, r} = U_{2, r} b_{2, r} + η_{2, r}

$\gamma_{2,r} = U_{2,r} b_{2,r} + \eta_{2,r}$

γ_{2, r} = [\begin{matrix} Δ t_{+} I (s_{1}) \dots Δ t_{+} I (s_{S}) \end{matrix}] + [\begin{matrix} b_{2, 1} \\ ⋮ \\ b_{2, S} \end{matrix}] + η_{2, r}

$\gamma_{2,r} = \begin{bmatrix} \Delta t_+ I(s_1) \dots \Delta t_+ I(s_S) \end{bmatrix} + \begin{bmatrix} b_{2,1}\\ \vdots \\ b_{2,S} \end{bmatrix} + \eta_{2,r}$

对于每个区域都将重复该步骤。然后，，如。虽然，也许不是，但是还有另一个常用的字母，例如 $\eta \sim \mathcal{N}(0,\Sigma_{\eta})$ $\epsilon$ $\Sigma$ $G$

编辑：其他Q / A有点帮助

这个Q / A很好，但是没有以完整的矩阵形式写出来

r mixed-model multilevel-analysis lme4-nlme

— rbatt
source

我怀疑本文是否对您的问题有“答案”，但它对HMM模型方程式的入门起到了很好的作用。忘了它源于SAS，它只是此类模型的出色概述。朱迪思·辛格（Judith Singer），《使用SAS Proc混合拟合多层次模型，层次模型和个人增长模型》，JEBS，1998年冬季，第1卷。24，第4号，第323-355页。

— Mike Hunter

您在这里阅读过2.3节吗？

— 罗伯特·朗

我已经阅读了它们，而类似的资源使我走了这么远。可能是我需要继续尝试，但是我找不到足够复杂的示例来使我对当前的方法充满信心。

— rbatt

据我了解，“嵌套”只是lmer模型中的交互。通过使用相同的语法可以增强此概念。所以笔者认为，REG：属可以通过一个单一分类变量进行处理，并在Z.只是另一组块

— deasmhumnha

我还要假设lmer会避免完美的共线性，并且只会在附加变量中包括非冗余相互作用。

— deasmhumnha

如果我正确理解了代码，为什么不简单地编写类似

y_{i} = (α + ν_{j [i]}^{(α)} + η_{k [i]}^{(α)}) + (β + ν_{j [i]}^{(β)} + η_{k [i]}^{(β)}) T_{i} + (δ + ν_{j [i]}^{(δ)} + η_{k [i]}^{(δ)}) (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \Big(\alpha + \nu_{j[i]}^{(\alpha)} + \eta_{k[i]}^{(\alpha)}\Big) + \Big(\beta + \nu_{j[i]}^{(\beta)} + \eta_{k[i]}^{(\beta)}\Big)T_{i} + \Big(\delta + \nu_{j[i]}^{(\delta)} + \eta_{k[i]}^{(\delta)}\Big)(T_{i} * Z_{i}) + \epsilon_i$

\begin{aligned} [ν_{j}^{(α)}, ν_{j}^{(β)}, ν_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{ν}) \\ [η_{j}^{(α)}, η_{j}^{(β)}, η_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{η}) \\ ϵ_{i} & \sim Normal (0, σ_{ϵ}) \end{aligned}

$\begin{aligned} \Big[\nu_{j}^{(\alpha)}, \nu_j^{(\beta)}, \nu_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\nu) \\ \Big[\eta_{j}^{(\alpha)}, \eta_j^{(\beta)}, \eta_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\eta)\\ \epsilon_i & \sim \text{Normal}(0, \sigma_\epsilon) \end{aligned}$

y_{i} = α_{j [i], k [i]} + β_{j [i], k [i]} T_{i} + δ_{j [i], k [i]} (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \alpha_{j[i],k[i]} + \beta_{j[i],k[i]}T_{i} + \delta_{j[i],k[i]}(T_i * Z_i) + \epsilon_i$

\begin{aligned} α_{j [i], k [i]} & = α + ν_{j}^{(α)} + η_{k}^{(α)} \\ β_{j [i], k [i]} & = β + ν_{j}^{(β)} + η_{k}^{(β)} \\ δ_{j [i], k [i]} & = δ + ν_{j}^{(δ)} + η_{k}^{(δ)} \end{aligned}

$\begin{aligned} \alpha_{j[i],k[i]} &= \alpha + \nu_{j}^{(\alpha)} + \eta_{k}^{(\alpha)} \\ \beta_{j[i],k[i]}&=\beta + \nu_{j}^{(\beta)} + \eta_{k}^{(\beta)}\\ \delta_{j[i],k[i]}&=\delta + \nu_{j}^{(\delta)} + \eta_{k}^{(\delta)}\\ \end{aligned}$

— 巴鲁姆
source