Questions tagged «mixed-model»

混合(aka多级或分层)模型是线性模型,其中包括固定效应和随机效应。它们用于对纵向或嵌套数据建模。

3
lmer中的方差-协方差矩阵
我知道混合模型的优点之一是它们允许为数据指定方差-协方差矩阵(化合物对称性,自回归,非结构化等)。但是,lmerR中的函数不允许对该矩阵进行简单说明。有谁知道lmer默认使用什么结构,为什么没有办法轻松指定它?

2
当在混合模型中将组视为随机与固定时,斜率估计存在很大差异
我了解,当我们相信某些模型参数在某些分组因子中随机变化时,我们会使用随机效应(或混合效应)模型。我希望拟合一个模型,该模型的响应已在分组因子上进行了归一化和居中(不完美,但非常接近),但是自变量x没有进行任何调整。这使我进行了以下测试(使用虚构数据),以确保如果确实存在,我会找到所需的效果。我运行了一个带有随机截距的混合效应模型(跨由定义的组f)和另一个以因子f作为固定效应预测因子的固定效应模型。我将R包lmer用于混合效果模型和基本函数lm()对于固定效果模型。以下是数据和结果。 请注意y,无论组如何,其变化都在0左右。并且该x变化与y组内的变化一致,但跨组的变化要大得多。y > data y x f 1 -0.5 2 1 2 0.0 3 1 3 0.5 4 1 4 -0.6 -4 2 5 0.0 -3 2 6 0.6 -2 2 7 -0.2 13 3 8 0.1 14 3 9 0.4 15 3 10 -0.5 -15 4 11 -0.1 -14 …

1
混合效应模型估计的标准误差应如何计算?
特别是,如何计算线性混合效应模型中固定效应的标准误差(从常识上来说)? 我被认为是典型的估计(,例如Laird和Ware [1982]中提出的估计,将得出SE为的大小被低估了,因为估计的方差成分被视为真实值。Var(β^)=(X′VX)−1Var(β^)=(X′VX)−1{\rm Var}(\hat\beta)=(X'VX)^{-1} 我已经注意到,由R包中的lme和summary函数产生的SE nlme不仅仅等于上述方差-协方差矩阵对角线的平方根。如何计算? 我还给人的印象是,贝叶斯方法使用反伽马先验来估计方差分量。在正确的设置下,这些结果是否与相同lme?

3
线性混合模型的陷阱
使用线性混合效应模型的主要陷阱是什么?在评估模型的适当性时,需要测试/注意的最重要的事情是什么?比较同一数据集的模型时,要寻找的最重要内容是什么?

5
使用lmer进行预测
您好,我有两个问题听起来像是我从未使用过的多级/混合模型的自然候选者。我希望尝试做一个更简单的介绍,如下所示:数据看起来像表单的许多行 x y innergroup outergroup 其中x是要对其进行回归的数值协变量(另一个数值变量),每个y属于一个内部组,每个内部组嵌套在一个外部组中(即,给定内部组中的所有y都属于同一个外部组) 。不幸的是,内部群有很多级别(成千上万),每个级别对y的观察都相对较少,因此我认为这种模型可能是合适的。我的问题是 如何编写这种多级公式? 一旦lmer拟合模型,如何从中进行预测?我已经找到了一些更简单的玩具示例,但是没有找到预报()函数。与这种技术的预测相比,大多数人似乎对推理更感兴趣。我有几百万行,所以计算可能是个问题,但是我总是可以适当地减少它。 我将不需要一段时间,但是我不妨开始考虑并尝试使用它。我有和以前相似的数据,但没有x,并且y现在是形式的二项式变量。y也表现出很多过度分散,即使在内部群体中也是如此。n中的大多数不超过2或3(或更小),因此为了得出每个y i的成功率的估算值,我一直在使用β-二项式收缩率估算器(α + k i)/(α + β + n i),在哪里(n,n−k)(n,n−k)(n,n-k)nnnyiyiy_i(α+ki)/(α+β+ni)(α+ki)/(α+β+ni)(\alpha+k_i)/(\alpha+\beta+n_i)通过MLE对每个内部组分别估计 α和 β。这已经足够了,但是数据稀疏仍然困扰着我,所以我想使用所有可用的数据。从一个角度看,这个问题比较容易,因为没有协变量,但是从另一个角度看,二项式性质使它变得更加困难。有人有高(或低!)级指导吗?αα\alphaββ\beta

2
REML或ML比较具有不同固定效果但具有相同随机效果的两个混合效果模型?
背景: 注意:我的数据集和R代码包含在文本下方 我希望使用AIC比较使用R中的lme4包生成的两个混合效果模型。每个模型都有一个固定效果和一个随机效果。模型之间的固定效果不同,但模型之间的随机效果保持不变。我发现如果我使用REML = T,则model2的AIC分数较低,但是如果我使用REML = F,则model1的AIC分数较低。 支持使用ML: Zuur等。(2009年;第122页)建议“要比较具有嵌套固定效应(但具有相同随机结构)的模型,必须使用ML估计而不是REML。” 这向我表明我应该使用ML,因为两个模型的随机效果都相同,但是固定效果却不同。[Zuur等。2009。R.Springer的《混合效应模型和生态学扩展》。 支持使用REML: 但是,我注意到当我使用ML时,两个模型之间与随机效应相关的剩余方差有所不同(模型1 = 136.3;模型2 = 112.9),但是当我使用REML时,模型之间是相同的(模型1 =模型2 = 151.5)。这对我来说意味着我应该改为使用REML,以便具有相同随机变量的模型之间的随机残差保持相同。 题: 在固定效应改变而随机效应保持不变的模型比较中,使用REML比ML更有意义吗?如果不是,您能解释为什么还是将我指向其他能解释更多内容的文献吗? # Model2 "wins" if REML=T: REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T) REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T) AIC(REMLmodel1,REMLmodel2) summary(REMLmodel1) summary(REMLmodel2) # Model1 "wins" …


3
线性混合模型的说明图是什么?
假设您在统计部门的图书馆中,并且您发现一本书的首页带有以下图片。 您可能会认为这是一本关于线性回归的书。 将使您想到线性混合模型的图是什么?

2
在基于计算机的实验/模拟中残差的独立性?
我对适合古科学中使用的特定类型模型的不同方法进行了基于计算机的评估。我的训练集很大,因此我随机(分层随机抽样)留出了测试集。我为训练集样本拟合了mmm种不同的方法,并使用mmm结果模型预测了测试集样本的响应,并针对测试集中的样本计算了RMSEP。这是一次运行。 然后,我多次重复此过程,每次我通过随机采样新的测试集来选择不同的训练集。 完成此操作后,我想研究mmm种方法中的任何一种是否具有更好或更差的RMSEP性能。我还想对成对方法进行多次比较。 我的方法是拟合线性混合效果(LME)模型,并为Run提供单个随机效果。我使用lmer()了lme4软件包中的数据,以适应multcomp软件包中的模型和函数,以执行多次比较。我的模特本质上是 lmer(RMSEP ~ method + (1 | Run), data = FOO) 其中method是一个因素,指示用于生成测试集的模型预测的哪种方法,并且Run是每个特定运行的指标 “实验”的。 我的问题是关于LME的残差。给定运行的单个随机效应我假设该的RMSEP值在某种程度上相关,但在运行之间不相关,这是基于随机效应所提供的诱导相关性。 运行之间的独立性这一假设有效吗?如果不是,那么在LME模型中是否可以解决这个问题,还是我应该寻求采用其他类型的静态分析来回答我的问题?

3
R中的零膨胀负二项式混合效应模型
是否有提供R中零膨胀负二项式混合效应模型估计的软件包? 我的意思是: 零充气,您可以在其中为零充气指定二项式模型,例如pscl包中的功能zeroinfl: zeroinfl(y〜X | Z,dist =“ negbin”) 其中Z是零通胀模型的公式; 模型计数部分的负二项式分布; 指定的随机效果类似于软件包lme4的功能lmer。 我知道glmmADMB可以做所有的事情,除了不能指定零通货膨胀的公式(这只是一个截距,即Z仅为1)。但是还有其他软件包可以做到吗? 我将非常感谢您的帮助!

1
重复测量的不平衡混合效应方差分析
我有手术期间接受2种不同治疗方法治疗的患者的数据。我需要分析它对心率的影响。每15分钟测量一次心率。 鉴于每个患者的手术时间可能不同,因此每个患者可以进行7到10次心率测量。因此,应使用不平衡的设计。我正在使用R进行分析。并且一直在使用ez软件包重复测量混合效果方差分析。但是我不知道如何分析不平衡的数据。有人可以帮忙吗? 也欢迎有关如何分析数据的建议。 更新: 按照建议,我使用lmer函数拟合了数据,发现最好的模型是: heart.rate~ time + treatment + (1|id) + (0+time|id) + (0+treatment|time) 结果如下: Random effects: Groups Name Variance Std.Dev. Corr id time 0.00037139 0.019271 id (Intercept) 9.77814104 3.127002 time treat0 0.09981062 0.315928 treat1 1.82667634 1.351546 -0.504 Residual 2.70163305 1.643665 Number of obs: 378, groups: subj, 60; time, …

1
R中混合模型公式中随机效应的威尔金森式表示法的起源,例如(1 | id)
R中的模型公式,例如 y ~ x + a*b + c:d 基于所谓的Wilkinson表示法:Wilkinson和Rogers 1973,用于方差分析的阶乘模型的符号描述。 本文没有讨论混合模型的符号(那时可能还不存在)。那么R中的混合模型公式lme4以及相关程序包中使用了什么,例如 y ~ x + a*b + c:d + (1|school) + (a*b||town) 来自?谁是第一次引入它们,何时引入?是否有针对他们的“ Wilkinson表示法”之类的商定术语?我专门指的是 (model formula | grouping variable) (model formula || grouping variable)

1
了解lmer()模型中随机效应的方差
我无法理解lmer()模型的输出。它是结果变量(支持)的简单模型,具有不同的状态截距/状态随机效应: mlm1 <- lmer(Support ~ (1 | State)) 结果为summary(mlm1): Linear mixed model fit by REML Formula: Support ~ (1 | State) AIC BIC logLik deviance REMLdev 12088 12107 -6041 12076 12082 Random effects: Groups Name Variance Std.Dev. State (Intercept) 0.0063695 0.079809 Residual 1.1114756 1.054265 Number of obs: 4097, groups: State, …

1
集群数据的正确引导技术?
我有一个关于在存在强集群的数据上使用适当的引导技术的问题。 我的任务是评估保险索赔数据的多元混合效应预测模型,方法是对最新的索赔数据评分当前的基线模型,以便确定该模型对哪些医疗事件包含最高诊治频率的预测效果如何(较高95%)。敏感性,特异性和阳性预测值(PPV)将用于评估模型的有效性。 自举似乎是建立敏感性,特异性和PPV百分比置信区间的正确方法。不幸的是,鉴于索赔数据是1)由护理提供者关联的,2)分组为护理事件的,并且在护理事件的前几个月中进行了更频繁的拜访(因此存在一些自相关性),因此不宜采用单纯的引导程序。在这里,对移动块自举技术的一种变化是否合适? 或三步引导程序可能会起作用:1)从数据中的不同提供者处进行替换的样本,然后2)从所选提供者的不同护理阶段中进行替换的样本,然后3)每个内的不同主张所进行的替换样本选择的情节。 非常感谢您的任何建议!

1
多站点研究的混合模型vs.合并标准误差-为什么混合模型效率更高?
我有一个数据集,其中包含来自多个站点的一系列“断棍”月度病例计数。我正在尝试从两种不同的技术中获得一个汇总估算值: 技术1:将Poisson GLM的“折断棒”安装到指标变量0/1上,并使用时间和时间^ 2变量来控制时间趋势。该0/1指标变量的估计值和SE是使用相当精确的矩量法向上或向下合并的,或者使用R中的tlnise包来合并以获得“贝叶斯”估计值。这类似于Peng和Dominici处理空气污染数据的方法,但站点数量较少(约十二个)。 技术2:放弃一些针对特定地点的时间趋势控件,并使用线性混合模型。尤其: lmer(cases ~ indicator + (1+month+I(month^2) + offset(log(p)), family="poisson", data=data) 我的问题涉及这些估计得出的标准误差。技术1的标准误差实际上使用的是每周一次而不是每月的时间设置,因此应该具有更高的精度。对于矩量法,估计的标准误差为〜0.206,对于tise的估计值则为〜0.306。 lmer方法给出的标准误差约为0.09。效果估计值是相当接近的,因此似乎并不是因为混合模型的效率大大提高,它们只是在不同的摘要估计值上归零。 这是合理的期望吗?如果是这样,为什么混合模型效率更高?这是普遍现象,还是该模型的特定结果?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.