使用lmer进行预测


18

您好,我有两个问题听起来像是我从未使用过的多级/混合模型的自然候选者。我希望尝试做一个更简单的介绍,如下所示:数据看起来像表单的许多行

x y innergroup outergroup

其中x是要对其进行回归的数值协变量(另一个数值变量),每个y属于一个内部组,每个内部组嵌套在一个外部组中(即,给定内部组中的所有y都属于同一个外部组) 。不幸的是,内部群有很多级别(成千上万),每个级别对y的观察都相对较少,因此我认为这种模型可能是合适的。我的问题是

  1. 如何编写这种多级公式?

  2. 一旦lmer拟合模型,如何从中进行预测?我已经找到了一些更简单的玩具示例,但是没有找到预报()函数。与这种技术的预测相比,大多数人似乎对推理更感兴趣。我有几百万行,所以计算可能是个问题,但是我总是可以适当地减少它。

我将不需要一段时间,但是我不妨开始考虑并尝试使用它。我有和以前相似的数据,但没有x,并且y现在是形式的二项式变量。y也表现出很多过度分散,即使在内部群体中也是如此。n中的大多数不超过2或3(或更小),因此为了得出每个y i的成功率的估算值,我一直在使用β-二项式收缩率估算器α + k i/α + β + n i,在哪里(n,nk)nyi(α+ki)/(α+β+ni)通过MLE对每个内部组分别估计 α β。这已经足够了,但是数据稀疏仍然困扰着我,所以我想使用所有可用的数据。从一个角度看,这个问题比较容易,因为没有协变量,但是从另一个角度看,二项式性质使它变得更加困难。有人有高(或低!)级指导吗?αβ


请验证我在收缩公式中插入的括号是否在您想要的位置。
ub

1
问题的第二部分(带有二进制变量)不应该是一个单独的问题吗?
chl

Answers:


17

使用R公式表达因子关系来自Wilkinson的符号,其中“ *”表示交叉和“ /”嵌套,但是处理混合效应模型(或更一般地说是随机效应)的公式有一些特殊性。例如,两个交叉的随机效果可能表示为(1|x1)+(1|x2)。我已经将您的描述解释为嵌套的情况,就像类在学校中嵌套(嵌套在各州等)一样,因此的基本公式lmer看起来像(除非另有说明,gaussian默认情况下使用家庭):

y ~ x + (1|A:B) + (1|A)

其中A和B分别对应于您的内部和外部因素。B嵌套在A内,并且都被视为随机因素。在较早的nlme软件包中,这将对应于lme(y ~ x, random=~ 1 | A/B)。如果将A视为固定因子,则公式应为y ~ x + A + (1|A:B)

但是值得D. Bates更精确地检查lme4软件包的规范,例如在他即将出版的教科书《lme4:使用R的混合效应建模》中,或者在同一网页上可以找到许多讲义。特别是,在拟合线性混合效果模型(R中的lme4程序包)中有此类嵌套关系的示例。John Maindonald的教程还提供了一个很好的概述:带有R的lme4软件包的“混合模型分析的剖析”。最后,关于lme4实现的R小插图的第3节包括一个嵌套结构分析的示例。

lme4中没有任何predict()功能(此函数现已存在,请参见下面的注释),并且您必须使用估算的固定(请参见?fixef)和随机(请参见?ranef)效果来计算自己的预测值,但也请参见 lme4中缺少predict函数的线程。您还可以使用mcmcsamp()函数根据后验分布生成样本。有时,它可能会发生冲突。有关更多更新的信息,请参见sig-me邮件列表。


3
要更新:lme4现在包括一个预测功能inside-r.org/packages/cran/lme4/docs/predict.mermod
酒吧

现在可以在以下位置找到predict.merMod的
DirtStats

10

EZ包包含ezPredict()函数,其获得11聚物从模型的预测,其中预测基于仅固定效应。它实际上只是glmm Wiki中详细介绍的方法的包装。


5

我将在Zelig中使用“ logit.mixed”函数,该函数是lime4的包装,非常便于进行预测和仿真。


似乎是在logit.mixed没有泽里格柯predcit()方法..
nassimhddd

3

lme4的开发版本具有内置的预测功能(predict.merMod)。可以在https://github.com/lme4/lme4/上找到。

可以在上面的页面上找到安装“来自lme4 r-forge存储库的最新开发二进制文件”的代码,该代码为:

install.packages("lme4", repos=c("http://lme4.r-forge.r-project.org/repos", getOption("repos")["CRAN"]))

1
请注意,它已不再是开发版本,predict已经使用了几年。
本·博克

1

斯蒂芬·劳登布什对“在层次分析手册一书章节很多小团体 ”。如果您只对x对y的效果感兴趣,而对更高级别的效果不感兴趣,则他的建议只是估算固定效果模型(即,所有可能的更高级别分组的虚拟变量)。

我不知道这对预测有多大适用性,但我可以想象他写的一些内容适用于您要实现的目标。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.