这种引导程序有名称吗?


9

考虑一个有多个人类参与者的实验,每个参与者在两种条件下进行了多次测量。可以将混合效果模型表示为(使用lme4语法):

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

现在,假设我要为该模型的预测生成自举置信区间。我想我已经想出了一种简单且计算效率高的方法,并且我确定我不是第一个想到这种方法的人,但是我很难找到任何以前的出版物来描述这种方法。这里是:

  1. 拟合模型(如上所述),将其称为“原始模型”
  2. 从原始模型中获得预测,将其称为“原始预测”
  3. 从与每个参与者的每个响应相关联的原始模型中获取残差
  4. 对残差重新采样,对参与者进行替换采样
  5. 将具有高斯误差的线性混合效应模型拟合到残差,将其称为“过渡模型”
  6. 根据每个条件计算临时模型的预测(这些预测将非常接近零),将其称为“临时预测”
  7. 将临时预测添加到原始预测中,将结果称为“重采样预测”
  8. 重复多次执行步骤4到7,为每个条件生成一次重采样预测分布,从中可以一次计算CI。

我已经在简单回归(即非混合模型)的背景下看到了“残差自举”程序,其中残差被采样为重采样的单位,然后将其添加到原始模型的预测中,然后在每次迭代的新模型上拟合一个新模型。引导程序,但这似乎与我描述的方法不同,我从未描述过残差永远不会被重新采样,人们只是在原始模型预测起作用的情况下获得临时模型。最后一个功能有一个非常不错的附带好处,即不管原始模型的复杂性如何,过渡模型都可以始终拟合为高斯线性混合模型,在某些情况下可以更快地进行拟合。例如,我最近有二项式数据和3个预测变量,我怀疑其中之一会引起强烈的非线性影响,因此我不得不使用二项式链接函数来使用广义加性混合建模。在这种情况下,拟合原始模型花费了一个多小时,而在每次迭代中拟合高斯LMM仅需几秒钟。

如果它已经是一个已知的过程,我真的不想在此声明优先权,因此,如果任何人都可以提供有关以前可能在何处描述的信息,我将不胜感激。(此外,如果此方法有任何明显的问题,请告诉我!)


1
只是一个侧面的评论,但这可能是相关的。彼得·麦卡拉(Peter McCullagh)在伯努利(Bernoulli)上发表了一篇论文,他证明了引导程序无法正确估计随机效应模型中的方差。
主教

@Mike(+1)这是一个写得很好的问题!
chl

1
您为什么不对替换后的参与者进行重新采样,然后再对他们的数据进行重新采样?这似乎更符合多级模型的精神,其中一个分布嵌套在另一个分布中。另一点是二项式数据存在潜在的问题,因为样本的末端将不太可能收敛。
约翰

@约翰:我更喜欢对残差进行重采样,因为(1)当原始模型难以估计时,速度更快;(2)它产生的CI消除了由于参与者均值之间的可变性引起的可变性。#2表示您想要显示原始数据和重复测量效果时不必创建多个图;您只需在原始数据上绘制这些方差之间去除的CI,即可将它们用于比较个体内重复出现的条件。当然,对于此类配置项的含义可能会感到困惑,但这就是数字标题的含义。
Mike Lawrence

@John:您能详细说明对这种方法对二项式数据适用性的担心吗?
Mike Lawrence

Answers:


-1

我的书《 Bootstrap Methods 2n​​d Edition》的书目到2007年为止。当然,使用正确的关键字进行Google搜索可能会更好。Freedman,Peters和Navidi在线性回归和计量经济学模型中进行了自举分析,但我不确定在混合模型情况下该如何做。Stine于1985年发表的JASA论文Bootstrap回归预测间隔是一个有趣的东西,如果您还没有看到的话。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.