考虑一个简单的线性混合模型,例如一个随机截距模型,在该模型中我们估计对在不同对象上的依赖性,并假设每个对象都有自己的随机截距:在这里,截距被建模为来自高斯分布,随机噪声也是Gaussian在语法上,该模型将写为。x y = a + b x + c i + ϵ 。Ç 我Ç 我〜Ñ(0 ,τ 2)ε 〜Ñ(0 ,σ 2)。ÿX
ÿ= a + b x + c一世+ ϵ 。
C一世C一世〜ñ(0 ,τ2)
ε 〜Ñ(0 ,σ2)。
lme4
y ~ x + (1|subject)
重写以下内容是有益的:
ÿ| Ç 〜ñ(a + b x + c ,σ2)Ç 〜Ñ(0 ,τ2)
这是指定相同概率模型的更正式方法。从这种表述中,我们可以直接看到随机效应不是“参数”:它们是未观察到的随机变量。那么,如何在不知道值的情况下估计方差参数呢? çC一世C
注意,上面的第一个方程描述了给定时的条件分布。如果我们知道和的分布,则可以通过对进行积分来计算的无条件分布。您可能将其称为总概率定律。如果两个分布都是高斯分布,那么得到的无条件分布也是高斯分布。ÿCCÿ∣ cÿC
在这种情况下,无条件分布只是,但是我们的观察结果并不是唯一的样本,因为每个对象有多个测量值。为了继续进行,我们需要考虑所有观测值的整个维向量的分布:其中是由和组成的块对角矩阵。您要求直觉,所以我想避免数学。重要的一点是,该方程式没有ñ(a + b x ,σ2+ τ2)ñÿ
ÿ〜 Ñ(a + b x,Σ )
Σ=σ2In+τ2IN⊗1Mσ2τ2c不再!
这就是实际适合观察到的数据的原因,这就是为什么有人说不是模型的参数的原因。
ci
当参数,,和合适时,就可以计算出每个的的条件分布。您在混合模型输出中看到的是这些分布的模式,也就是条件模式。abτ2σ2cii