考虑一个有多个人类参与者的实验,每个参与者在两种条件下进行了多次测量。可以将混合效果模型表示为(使用lme4语法):
fit = lmer(
formula = measure ~ (1|participant) + condition
)
现在,假设我要为该模型的预测生成自举置信区间。我想我已经想出了一种简单且计算效率高的方法,并且我确定我不是第一个想到这种方法的人,但是我很难找到任何以前的出版物来描述这种方法。这里是:
- 拟合模型(如上所述),将其称为“原始模型”
- 从原始模型中获得预测,将其称为“原始预测”
- 从与每个参与者的每个响应相关联的原始模型中获取残差
- 对残差重新采样,对参与者进行替换采样
- 将具有高斯误差的线性混合效应模型拟合到残差,将其称为“过渡模型”
- 根据每个条件计算临时模型的预测(这些预测将非常接近零),将其称为“临时预测”
- 将临时预测添加到原始预测中,将结果称为“重采样预测”
- 重复多次执行步骤4到7,为每个条件生成一次重采样预测分布,从中可以一次计算CI。
我已经在简单回归(即非混合模型)的背景下看到了“残差自举”程序,其中残差被采样为重采样的单位,然后将其添加到原始模型的预测中,然后在每次迭代的新模型上拟合一个新模型。引导程序,但这似乎与我描述的方法不同,我从未描述过残差永远不会被重新采样,人们只是在在原始模型预测起作用的情况下获得临时模型。最后一个功能有一个非常不错的附带好处,即不管原始模型的复杂性如何,过渡模型都可以始终拟合为高斯线性混合模型,在某些情况下可以更快地进行拟合。例如,我最近有二项式数据和3个预测变量,我怀疑其中之一会引起强烈的非线性影响,因此我不得不使用二项式链接函数来使用广义加性混合建模。在这种情况下,拟合原始模型花费了一个多小时,而在每次迭代中拟合高斯LMM仅需几秒钟。
如果它已经是一个已知的过程,我真的不想在此声明优先权,因此,如果任何人都可以提供有关以前可能在何处描述的信息,我将不胜感激。(此外,如果此方法有任何明显的问题,请告诉我!)