简历问题
我正在尝试给出混合效果模型的详细且简洁的数学表示。我lme4
在R中使用该软件包。我的模型的正确数学表示是什么?
数据,科学问题和R代码
我的数据集由不同地区的物种组成。我正在测试某个物种的流行率是否在导致灭绝(灭绝不一定是永久性的;它可以重新定殖)或定居之后的时间内发生变化。
lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))
- 患病率是某个区域年份中某物种所占地层的比例
- 时间是一个连续变量,表示灭绝或定植的时间;它总是积极的
- 类型是具有两个级别的类别变量。这两个级别是“-”和“ +”。当type为-时,它是一个殖民化(默认级别)。当type为+时,表示灭绝。
- Reg是具有9个级别的类别变量,表示区域
- spp是分类变量;级别数因地区而异,在48级和144级之间变化。
换句话说:响应变量是患病率(占地层的比例)。固定效果包括1)和拦截,2)事件发生的时间以及3)事件发生的时间与事件类型(殖民化或灭绝)之间的相互作用。这3种固定效应中的每一种在区域之间随机变化。在一个区域内,每种效应在物种之间随机变化。
我试图弄清楚如何为模型编写数学方程式。我想我理解R代码中发生的事情(尽管,我确信我有一些知识空白,希望写出正式的数学表达式可以增进我的理解)。
我已经通过网络和这些论坛进行了很多搜索。可以肯定的是,我发现了大量有用的信息(也许我会在对此问题的编辑中链接到其中一些信息)。但是,我无法完全找到将R代码的“ Rosetta Stone”转换为数学公式(我对代码更满意)是否真的可以帮助我确认我正确理解了这些方程式。实际上,我知道已经存在一些差距,但是我们会解决的。
我的尝试
混合效应模型的基本形式,在矩阵表示法中为(我的理解):
γ
- Δ 吨Δ 吨+是固定效果的设计矩阵,是定居后的时间(),是消灭后的时间()
time
time:type
- 是随机效应的设计矩阵(级别1?),I()是指标函数,如果样本属于指定区域,则给出1,否则,则给出0,将r索引以指示九个区域之一。
- γ和包含参数
- Σ是错误;我不确定如何解释,尽管我意识到这些方差/协方差矩阵之一将表示斜率和截距之间的协方差,例如
假设到目前为止一切正确,这意味着我在顶级水平上是不错的。但是,解释嵌套在每个区域中的参数的特定于物种的变化,让我更加难受。
但是我对可能有意义的事情有所了解...
每个参数均来自区域内特定物种的预测变量和参数的线性组合。对于每个区域,存在3行,分别对应于3个预测变量。每个可以分别表示为γ
-
- 其中 是特定于区域的设计矩阵,而预测变量,是该区域的参数的1 x S矩阵(区域中的丰富度=,例如48或144),和是误差项的矩阵
具体来说,对于给定区域,每个将是:
对于每个区域都将重复该步骤。然后, ,如。虽然,也许不是,但是还有另一个常用的字母,例如
编辑:其他Q / A有点帮助