将多级模型拟合到R中的复杂测量数据

11

我正在寻找有关如何在R中使用多级模型分析复杂调查数据的建议。我已使用该survey软件包对一级模型中选择的不平等概率进行加权，但是此软件包没有用于多层建模的功能。该lme4软件包非常适合用于多层建模，但是我不知道有一种方法可以在不同级别的聚类中包含权重。Asparouhov（2006）提出了问题：

多级模型通常用于分析群集抽样设计中的数据。但是，这样的抽样设计通常在集群级别和单个级别使用不相等的选择概率。在一个或两个级别上分配采样权重以反映这些概率。如果在任何一个级别上都忽略了采样权重，则参数估计值可能会出现明显偏差。

用于两级模型的一种方法是在MPLUS中实现的多级伪最大似然（MPML）估计器（Asparouhov等，α）。Carle（2009）回顾了主要的软件包，并提出了一些有关如何进行的建议：

为了使用复杂的调查数据和设计权重正确地执行MLM，分析人员需要可以在程序外部包括按比例缩放的权重并包括“新”缩放的权重而无需自动修改程序的软件。当前，三个主要的MLM软件程序允许这样做：Mplus（5.2），MLwiN（2.02）和GLLAMM。不幸的是，HLM和SAS都无法做到这一点。

West和Galecki（2013）给出了更新的评论，我将详细引用相关文章：

有时，分析人员希望使LMM适合从复杂设计的样本中收集的数据集（见Heeringa等，2010，第12章）。复杂的样本设计通常具有以下特征：将人群划分为各个阶层，从阶层内部对个体集群进行多阶段选择，以及集群和最终样本个体的选择概率均等。这些不平等的选择概率通常会导致构建个体的采样权重，从而确保在纳入分析时对描述性参数进行无偏估计。这些权重可能会针对调查无响应而进一步调整，并根据已知的总体总数进行校准。传统上，分析人员在估计回归模型时可能会考虑基于设计的方法来整合这些复杂的采样功能（Heeringa等，2010）。最近，统计学家已经开始探索基于模型的方法来分析这些数据，使用LMM来结合采样层的固定效应和采样群的随机效应。

开发基于模型的方法来分析这些数据的主要困难是选择适当的方法来合并抽样权重（有关问题的摘要，请参见Gelman，2007）。Pfeffermann等。（1998），Asparouhov和Muthen（2006）以及Rabe-Hesketh和Skrondal（2006）开发了用于以合并调查权重的方式估算多层次模型的理论，Rabe-Hesketh和Skrondal（2006），Carle（2009）和Heeringa等。（2010年，第12章）介绍了使用当前软件程序的应用程序，但这仍然是统计研究的活跃领域。能够适应LMM的软件过程处于实现迄今为止文献中提出的用于合并复杂设计特征的方法的各个阶段，分析人员在将LMM拟合到复杂的样本调查数据时需要考虑这一点。有兴趣将LMM拟合到从复杂样本调查收集的数据中的分析人员，将被吸引到能够将调查权重正确纳入估计程序（HLM，MLwiN，Mplus，xtmixed和gllamm）的程序。区域。

这使我想到我的问题：是否有人对将LMM拟合R中的复杂测量数据有最佳实践建议？

r mixed-model weighted-sampling cluster-sample

— 埃里克·格林
source

1

您好，i've never said it before从这篇关于addhealth的帖子开始的段落中的链接可能会引起人们的关注。。

— ：：

1

@AnthonyDamico，链接现在已断开：-（

— Ben Bolker

@BenBolker！：他们已经改变了微观的名字，所以我也还有:)新的位置 asdfree.com/search/label/...

— 安东尼达米科

抱歉，如果我对您的问题有误解，但我的理解是您从实验设计中获得了固定的（已知）权重，并且您想使用包含这些设计权重的线性混合模型。软件包中的lmer函数lme4允许weights为模型拟合过程指定参数，因此，如果您具有固定的设计权重，则应该能够将其与该参数合并。我在这里碰错了吗？是否有某些原因不能满足您的需求？

— 本-恢复莫妮卡

4

据我所知，如果您确实需要混合模型（例如，如果您关心方差分量），那么目前您还不能在R中真正做到这一点

weights参数lme4::lmer() 不会执行您想要的操作，因为lmer()将权重解释为精确权重而不是采样权重。与普通线性模型和广义线性模型相比，您甚至无法使用将采样权重视为混合模型的精确权重的代码来获得正确的点估计。

如果您不需要估计方差分量而只想使模型的多级特征获得正确的标准误差，您可以使用survey::svyglm()。

— 托马斯·拉姆利
source

0

现在，至少对于线性和逻辑多级模型，可以选择使用WeMix软件包。但是，与在Stata或MPlus中运行这些模型相比，它似乎非常慢。

— 吮吸率
source

0

我也面临着同样的问题。在过去几天中进行了大量搜索之后，我发现BIFIEsurvey软件包最接近分析具有样本和重复权重以及合理值的复杂调查数据的多级模型：https : //cran.r-project.org/web /packages/BIFIEsurvey/index.html但是，该软件包仅限于两级模型。我还了解到，“ intsvy”软件包的作者长期计划要使“ intsvy”能够分析多层模型，但到目前为止，它仍然不能。如果在解决该问题方面取得了我可能会意外错过的任何进展，那么如果有人可以分享我会很高兴。

— G_科尼亚罗夫
source