Questions tagged «mixed-model»

混合(aka多级或分层)模型是线性模型,其中包括固定效应和随机效应。它们用于对纵向或嵌套数据建模。

2
混合模型的交叉验证?
我和我的同事正在R中拟合一系列线性和非线性混合效应模型。我们被要求对拟合的模型进行交叉验证,以便人们可以验证观察到的效应是相对可推广的。这通常是一项琐碎的任务,但是在我们的案例中,我们必须将整个数据分为一个培训部分和一个测试部分(出于CV目的),它们没有共同的水平。例如, 训练数据可以基于组1,2,3,4;然后,对拟合的模型在组5上进行交叉验证。 因此,由于在训练数据上估计的基于组的随机效应不适用于测试数据,因此会产生问题。因此,我们无法对模型进行简历。 有没有相对简单的解决方案?还是有人编写了解决该问题的软件包?任何提示都欢迎! 谢谢!

3
随机效应可以仅应用于分类变量吗?
这个问题听起来可能很愚蠢,但是... 随机效应仅适用于分类变量(例如个体ID,人口ID等)是正确的吗,例如说是分类变量:X一世X一世x_i ÿ一世ÿ一世y_i〜βX一世βX一世\beta_{x_i} βX一世βX一世\beta_{x_i}〜ñø ř 米(μ ,δ2)ñØ[R米(μ,δ2)Norm(\mu, \delta^2) 但是根据原理,随机效应不能应用于连续变量(例如高度,质量...),例如:ž一世ž一世z_i ÿ一世ÿ一世y_i〜α + β⋅ž一世α+β⋅ž一世\alpha + \beta \cdot z_{i} 因为只有一个系数不能约束?听起来合乎逻辑,但我想知道为什么统计文献中从未提及它!谢谢!ββ\beta 编辑:但是如果我约束像〜?那是随机效应吗?但这与我对施加的约束不同-在这里,我约束变量,而在前面的示例中,我约束了系数!对我来说,它开始看起来像是一团糟。。。不管怎么说,放这个约束没有多大意义,因为是已知值,所以也许这个想法很奇怪:-)ž一世ž一世z_iž一世ž一世z_iñø ř 米(μ ,δ2)ñØ[R米(μ,δ2)Norm(\mu, \delta^2)βX一世βX一世\beta_{x_i}ž一世ž一世z_i

2
成对的重复测量方差分析还是混合模型?
我被要求分析来自临床试验的一些数据,以寻找两种测量血压的方法。我有来自50个主题的数据,每个主题使用每种方法的测量范围介于2到57个之间。 我想知道如何最好地进行。 显然,我需要一个解决方案,该解决方案应考虑以下事实:血压测量值是成对的(两种方法同时测量),还需要时变协变量(每个患者的观察次数不同),以及患者可变性。 我曾想过以某种方式将其纳入重复测量方差分析中,但我想可能需要采用混合模型方法。 我会很感激您能提供的任何有用的建议。 我是R的新手,但是对开发技能感到非常兴奋,并且我在Stata拥有一定的经验,因此可以随时依靠。
9 r  anova  mixed-model  stata 

1
这种引导程序有名称吗?
考虑一个有多个人类参与者的实验,每个参与者在两种条件下进行了多次测量。可以将混合效果模型表示为(使用lme4语法): fit = lmer( formula = measure ~ (1|participant) + condition ) 现在,假设我要为该模型的预测生成自举置信区间。我想我已经想出了一种简单且计算效率高的方法,并且我确定我不是第一个想到这种方法的人,但是我很难找到任何以前的出版物来描述这种方法。这里是: 拟合模型(如上所述),将其称为“原始模型” 从原始模型中获得预测,将其称为“原始预测” 从与每个参与者的每个响应相关联的原始模型中获取残差 对残差重新采样,对参与者进行替换采样 将具有高斯误差的线性混合效应模型拟合到残差,将其称为“过渡模型” 根据每个条件计算临时模型的预测(这些预测将非常接近零),将其称为“临时预测” 将临时预测添加到原始预测中,将结果称为“重采样预测” 重复多次执行步骤4到7,为每个条件生成一次重采样预测分布,从中可以一次计算CI。 我已经在简单回归(即非混合模型)的背景下看到了“残差自举”程序,其中残差被采样为重采样的单位,然后将其添加到原始模型的预测中,然后在每次迭代的新模型上拟合一个新模型。引导程序,但这似乎与我描述的方法不同,我从未描述过残差永远不会被重新采样,人们只是在在原始模型预测起作用的情况下获得临时模型。最后一个功能有一个非常不错的附带好处,即不管原始模型的复杂性如何,过渡模型都可以始终拟合为高斯线性混合模型,在某些情况下可以更快地进行拟合。例如,我最近有二项式数据和3个预测变量,我怀疑其中之一会引起强烈的非线性影响,因此我不得不使用二项式链接函数来使用广义加性混合建模。在这种情况下,拟合原始模型花费了一个多小时,而在每次迭代中拟合高斯LMM仅需几秒钟。 如果它已经是一个已知的过程,我真的不想在此声明优先权,因此,如果任何人都可以提供有关以前可能在何处描述的信息,我将不胜感激。(此外,如果此方法有任何明显的问题,请告诉我!)

2
我是否正确指定了我的lmer模型?
我搜寻了Google和该站点,但对lme4库中的lmer函数仍然感到困惑。 我从不同的精神病房收集了一些数据,这些数据具有多层次的结构。为简化起见,我将选择两个2级和2个1级变量,尽管实际上我还有几个。 2级-WardSize [这是病房的人数]和WAS [这是病房的“好”程度的一种度量] 告诉R谁在哪个病房中的分组变量称为“ Ward” 一级-性别[很明显是性别]和BSITotal [这是症状严重程度的度量] 结果是自我拒绝,这又是听起来的样子。 我有这个公式: help = lmer(公式= Selfreject〜WardSize + WAS +性别+ BSITotal +(1 | Ward)) 我希望这意味着“每个人的得分都与他们自己的性别和症状的严重程度有关,并且对病房的影响与病房的大小以及病情的“好”程度有关。 它是否正确?使我感到困惑的是,除了最后给出的病房级别截距之外,我看不到R如何分辨哪个是1级和哪个2级变量。 如果有人能解释这个概念,那么像我这样的白痴就可以理解,那就更好了。 非常感谢!

3
如何在GLMM中加快固定效果的计算?
我正在进行仿真研究,需要从广义线性混合模型(实际上,是固定效果的两个估算值的一个乘积,一个是GLMM,另一个是LMM的乘积)的自举估计。要做好这项研究,每次大约需要进行1000次或1500次引导复制的1000次模拟。这需要在我的计算机上花费大量时间(很多天)。 How can I speed up the computation of these fixed effects? 更具体地讲,我对对象进行了三种方式的重复测量,从而产生了变量X,M和Y,其中X和M是连续的,而Y是二进制的。我们有两个回归方程 其中Y用于底层潜连续可变和误差不会IID。 我们要引导的统计信息是。因此,每个引导复制都需要安装LMM和GLMM。我的R代码是(使用lme4)中号=α0+α1个X+ϵ1个中号=α0+α1个X+ϵ1个M=\alpha_0+\alpha_1X+\epsilon_1 ÿ∗=β0+β1个X+β2中号+ϵ2ÿ∗=β0+β1个X+β2中号+ϵ2Y^*=\beta_0+\beta_1X+\beta_2M+\epsilon_2∗∗^*ÿÿYα1β2α1β2\alpha_1\beta_2 stat=function(dat){ a=fixef(lmer(M~X+(X|person),data=dat))["X"] b=fixef(glmer(Y~X+M+(X+M|person),data=dat,family="binomial"))["M"] return(a*b) } 我意识到如果我将拟合为线性模型,我将获得相同的估算值,这样可以节省一些时间,但是对于,相同的技巧不起作用。α1α1\alpha_1β2β2\beta_2 我是否只需要购买速度更快的计算机?:)
9 r  mixed-model 

1
我可以将混合模型与只有1个观察值的对象拟合吗?
我有一个非常大的数据集,随着时间的推移,我对各个位置进行了重复测量。有些位置可能有10个数据点,而有些位置只有1个数据点。我拟合了混合模型,并将位置用作随机效果。我的问题是我是否仍可以使用只有1个数据点的位置(因为您不能仅用1个数据绘制回归线)还是应该排除这些位置?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.