关于在R中指定线性混合模型以使用附加嵌套结构重复测量数据的问题


10

数据结构

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

完整的候选模型

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)
  • 来自试验的反应时间集中在会话中,而反过来又聚集在患者中
  • 每个试验的特征可以是ASCORE和HSCORE的两个连续协变量(介于1-9之间)以及运动反应(撤回或接近)
  • 疗程的特点是药物摄入(安慰剂或活性Pharmaccon)和饱腹感(禁食或预食)

建模和R语法?

我正在尝试使用加载的均值结构指定适当的完整模型,该模型可用作自顶向下模型选择策略的起点。

具体问题:

  • 语法是否正确指定了聚类和随机效应?
  • 除了语法之外,该模型是否适合上述主题设计?
  • 完整模型应该指定固定效果的所有交互作用,还是仅指定我真正感兴趣的交互作用?
  • 我没有在模型中包括STIM因子,该因子表征了试验中使用的特定刺激类型,但是我不希望以任何方式进行估算-我应该将其指定为随机因子,因为它具有123个水平并且很少每个刺激类型的数据点?

如果我在这里找不到建议,我真的不知道该问谁?也许您知道任何专门的混合模型论坛,甚至是愿意花一点钱咨询的专家?
Cel

3
@Cel,您好,您似乎在模型中具有所有交互,包括5向,4向和3向交互。我不确定这种情况,但是通常会大大超出数据的范围,这会使您的结果难以推广。向后选择(如果必须使用)不必从完全饱和的模型开始-应该从您认为合理的最大模型开始。您能完全减少吗?
2012年

@Macro很高兴知道,我将只包括看起来合理的交互。您对其他问题有什么建议吗?如果您愿意,也许可以把它作为答案,这样我就可以接受。
Cel

Answers:


16

我将依次回答您的每个问题。

语法是否正确指定了聚类和随机效应?

用数学术语来说,您在此处适合的模型是模型

Yijk=Xijkβ+ηi+θij+εijk

哪里

  • ķ Ĵ Yijk是会话对个体观察的反应时间。kji

  • ķĴXijk是会话在个体上观察的预测向量(在您编写的模型中,它由所有主要影响和所有相互作用组成)。kji

  • θ ĴĴ ε Ĵ ķηi是人随机效应,它引起对同一人的观察之间的相关性。是个体的会话的随机效应,是剩余误差项。iθijijεijk

  • β是回归系数向量。

第14-15页所述,此模型对于指定会话嵌套在个人内部是正确的,根据您的描述就是这种情况。

除了语法之外,该模型是否适合上述主题设计?

我认为该模型是合理的,因为它确实尊重数据中的嵌套结构,而且我确实认为,正如该模型所断言的那样,可以将个人和会话合理地设想为随机效应。您应查看散点图等预测变量与响应之间的关系,以确保正确指定了线性预测变量()。其他标准回归诊断程序也应进行检查。Xijkβ

完整模型应该指定固定效果的所有交互作用,还是仅指定我真正感兴趣的交互作用?

我认为从这样一个高度饱和的模型开始可能不是一个好主意,除非从本质上讲有意义。正如我在评论中说的那样,这可能会过度适合您的特定数据集,并可能使您的结果难以推广。关于模型选择,如果您确实从完全饱和的模型开始并进行了向后选择(此站点上的某些人有充分的理由反对),那么您必须确保尊重模型中的层次结构。也就是说,如果您从模型中消除了较低级别的交互,则还应该删除所有涉及该变量的较高级别的交互。有关此内容的更多讨论,请参见链接的线程。

我没有在模型中包括STIM因子,该因子表征了试验中使用的特定刺激类型,但是我不希望以任何方式进行估算-我应该将其指定为随机因子,因为它具有123个水平并且很少每个刺激类型的数据点?

不可否认的是,对应用程序一无所知(因此,请带着一粒盐),这听起来像是固定效果,而不是随机效果。也就是说,治疗类型听起来像一个变量,该变量将对应于平均响应的固定变化,而不是会导致具有相同刺激类型的受试者之间产生相关性的变量。但是,它是123级因子的事实使得输入模型变得很麻烦。我想我想知道您希望这种效果有多大。不管影响的大小如何,由于这是线性模型,因此不会在斜率估计中引起偏差,但是如果忽略该偏差,则可能会使标准误差大于其他情况。


2
哇。谢谢你,宏,我希望我能给出更多的观点。
2012年

ηiθjθj
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.