将固定效果嵌套在一个随机效果中是否有意义,或者如何用R(aov和lmer)编码重复的度量?


23

我一直在通过@conjugateprior浏览lm / lmer R公式的概述,并被以下条目弄糊涂了:

现在假设A是随机的,但B是固定的,并且B嵌套在A内。

aov(Y ~ B + Error(A/B), data=d)

下面lmer(Y ~ B + (1 | A:B), data=d) 为相同情况提供了类似的混合模型公式。

我不太明白这是什么意思。在将受试者分为几组的实验中,我们将在固定因子(组)中嵌套一个随机因子(对象)。但是,如何将固定因子嵌套在随机因子中呢?有固定的嵌套在随机主题内的东西吗?可能吗 如果不可能,那么这些R公式有意义吗?


提到该概述部分基于个性项目的页面,该页面基于R中重复度量的教程,而页面本身基于R进行ANOVA。以下是重复测量方差分析的示例:

aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)

在这里,向受试者显示不同价的单词(三个级别的因子),并测量其回忆时间。每个主题都有三个价位的单词。我没有看到此设计中嵌套的任何内容(按照此处的最佳答案,它看起来像是交叉的),因此在这种情况下,我会天真的认为Error(Subject)(1 | Subject)应该使用适当的随机术语。在Subject/Valence“筑巢”(?)是混淆。

请注意,我确实知道这Valence是一个内部因素。但我认为这不是科目中的“嵌套”因素(因为所有科目都经历的所有三个级别Valence)。


更新。我正在探索有关在R中编码重复测量方差分析的CV问题。

  • 在此,以下内容用于固定的内部/重复测量值A和随机值subject

    summary(aov(Y ~ A + Error(subject/A), data = d))
    anova(lme(Y ~ A, random = ~1|subject, data = d))
    
  • 对于两个固定的主题内/重复测量效果,此处为A和B:

    summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d))
    lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d) 
    
  • 以下是三个主体内效果A,B和C:

    summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d))
    lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)
    

我的问题:

  1. 为什么Error(subject/A)Error(subject)呢?
  2. 它是(1|subject)(1|subject)+(1|A:subject)或干脆(1|A:subject)
  3. (1|subject) + (1|A:subject)还是(1|subject) + (0+A|subject),为什么不简单(A|subject)

到目前为止,我已经看到一些线程声称其中某些事物是等效的(例如,第一个:它们是相同的,对SO是相反的主张;第三个:它们是相同的,即某种主张)。是吗


2
简短地说一下,从严格的概念上讲,我认为将固定因子嵌套在随机因子中几乎没有任何意义。我已经读过至少一位教科书作者也这么说(目前还不记得参考)。就是说,您上面编写的某些模型规范在统计上可能等同于更有意义的模型……我必须对此进行更多考虑并对其进行研究。
杰克·韦斯特伦

4
实际上,如果您考虑R解释A / B语法的方式,我想这很有意义:它只是将其扩展为A + A:B。因此,如果我们考虑一个像这样的随机项subject/condition,这在概念上是可疑的,因为它似乎暗示条件嵌套在主体中,当显然相反时,但实际上合适的模型是subject + subject:condition,这是具有随机主体效应的完美有效模型和随机对象X斜率。
Jake Westfall

@JakeWestfall谢谢,这是我现在自己考虑的事情,但是我非常希望有人能正确地解释它。实际上,令我惊讶的是,这真是一个不平凡的问题。我本来希望您成为马上回答的人之一。但这是一种缓解,因为起初我以为我的困惑一定是愚蠢的。顺便说一句,在和公式上有一些标准参考吗?如果我想获得有关其确切功能(它是包装纸?)以及这些术语如何工作的权威资料,我应该在哪里看?lmaovaovlmError()
变形虫说恢复莫妮卡

1
@amoeba是的,在某种意义上aov是一个包装,用于最小二乘方拟合,但是需要做一些额外的工作(特别是翻译的术语)。权威来源是Chambers等人(1992)中提供的源代码或参考。但是我无权访问该参考,因此我将研究源代码。lmlmaovErrorlmhelp("aov")
罗兰

Answers:


12

在混合模型中,因素的处理是固定的还是随机的,尤其是与它们是交叉,部分交叉还是嵌套的结合会导致很多混乱。同样,在方差分析/设计实验世界和混合/多层模型世界中,嵌套的含义似乎在术语上有所不同。

我不公开知道所有答案,并且我的答案将不完整(并可能会提出其他问题),但是我将尝试在此处解决一些问题:

将固定效果嵌套在一个随机效果中是否有意义,或者如何用R(aov和lmer)编码重复的度量?

(问题标题)

不,我认为这没有道理。当我们处理重复测量时,通常无论重复测量的结果是随机的,我们都称其为Subject,并且lme4我们希望将Subject一个或多个测量的右侧包括|在测量的随机部分中。式。如果我们还有其他随机效应,那么它们要么是交叉的,要么是部分交叉的,要么是嵌套的-我对这个问题的回答就是这样

这些以方差分析法设计的实验的问题似乎在于,在重复测量的情况下,如何处理通常被认为是固定的因素,而OP正文中的问题正说明了这一点:

为什么是错误(主题/ A)而不是错误(主题)?

我通常不使用它,aov()所以我可能会丢失一些东西,但是对我来说Error(subject/A),在链接问题的情况下,这是非常误导的。Error(subject)实际上导致完全相同的结果。

是(1 | subject)或(1 | subject)+(1 | A:subject)还是简单地(1 | A:subject)?

这与这个问题有关。在这种情况下,以下所有随机效应公式均会得出完全相同的结果:

(1|subject)
(1|A:subject)
(1|subject) + (1|A:subject)
(1|subject) + (1|A:subject) + (1|B:subject)

但是,这是因为问题中的模拟数据集在任何范围内都没有变化,它只是使用创建的Y = rnorm(48)。如果我们采用真实的数据集,例如中的cake数据集,lme4则会发现情况通常并非如此。根据文档,这是实验设置:

用三种不同配方制作并在六个不同温度下烘烤的巧克力蛋糕的破损角度数据。这是一个分图设计,配方为整体装置,不同的温度应用于子装置(重复内)。实验说明表明,重复编号代表时间顺序。

包含以下5个变量的270个观测值的数据框。

replicate 1到15级的因子

recipe A,B和C级的因子

temperature 175 <185 <195 <205 <215 <225级别的有序因子

temp 烘烤温度的数值(华氏度)。

angle 一个数值矢量,给出了蛋糕破裂的角度。

因此,我们在中有重复的度量replicate,并且我们对固定因子recipe和也很感兴趣temperature(我们可以忽略,temp因为这只是对的不同编码temperature),并且可以使用xtabs以下方式可视化情况:

> xtabs(~recipe+replicate,data=cake)

     replicate
recipe 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
     A 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     B 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     C 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6

如果recipe是随机效应,我们可以说这些是交叉随机效应。绝不recipe A属于replicate 1或任何其他复制品。

> xtabs(~temp+replicate,data=cake)

     replicate
temp  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
  175 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  185 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  195 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  205 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  215 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  225 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3

同样适用于temp

因此,我们可能适合的第一个模型是:

> lmm1 <-  lmer(angle ~ recipe * temperature + (1|replicate), cake, REML= FALSE)

这将把它们replicate当作随机变化的唯一来源(当然不是剩余的)。但是食谱之间可能会有随机差异。因此,我们可能会试图将recipe另一种(交叉)随机效应包括在内,但这是不明智的,因为我们只有3个级别,recipe因此我们不能期望模型能够很好地估计方差分量。因此,我们可以将其replicate:recipe用作分组变量,这将使我们能够将复制品和配方的每种组合视为一个单独的分组因子。因此,在上述模型中,对于每个级别,replicate我们将有15个随机截距,而对于每个单独的组合,我们现在将有45个随机截距:

lmm3 <-  lmer(angle ~ recipe * temperature + (1|replicate:recipe) , cake, REML= FALSE)

请注意,我们现在有(非常微小)不同的结果,这表明由于配方的缘故有些随机变化,但变化不大。

我们也可以使用来做同样的事情temperature

现在,回到您的问题,您还问

为什么(1|subject) + (1|A:subject)(1|subject) + (0+A|subject)连或干脆(A|subject)

我不整肯定这个地方(使用随机的斜坡)来自-它似乎并没有在两座相连的问题出现-但我的问题(1|subject) + (1|A:subject)是,这是完全一样(1|subject/A)的是其手段A是嵌套subject,这在转弯(对我而言)意味着每个等级A出现在1个等级中,subject而这里只有1个等级显然不是这种情况。

在考虑了更多问题之后,我可能会添加和/或编辑此答案,但我想将最初的想法记下来。


非常感谢(+1)。我不确定我是否了解cake数据集。似乎复制嵌套在配方中;原因xtabs未显示出来,这恰恰是您在嵌套与交叉回答中描述的原因:复制代码混乱地编码为1-15,而不是1-45。对于每个食谱,用6个蛋糕制作15个“复制品”。然后将每个蛋糕在不同的温度下烘烤。因此,配方是受试者之间的因素,而温度是受试者内部的因素。因此,根据您的回答,应该是(1|recipe/replicate)。没有?(1|replicate:recipe)可能是等效的。
变形虫说恢复莫妮卡

我的问题仅集中在主题内因素上,因此就好像cake只限于一个食谱。关于第三点,您不确定自己来自何处,请参阅我的问题解答中的最后一个链接,其中包含三个主题内因素的示例。另请参见杰克在此问题下的受评评论,他提到随机斜率。
变形虫说莫妮卡(Monica)恢复

对于aov您来说是正确的,如果没有其他因素,似乎Error(subject/A)并会Error(subject)产生相同的结果,但是请从具有两个因素的链接线程中举例说明,并且存在Error(subject/(A*B))Error(subject)不相等。我目前的理解是,因为前者包括随机斜率。
变形虫说莫妮卡(Monica)恢复

@amoeba cake数据集不是一个很好的工作示例。我很抱歉。我将对其进行更深入的研究,可能会尝试找到一个更好的示例。
罗伯特·朗

谢谢。期待任何更新以及Placidia正在准备的更新。同时,我想我会在这里赏金的。
变形虫说恢复莫妮卡

3

哎呀 机敏的评论者发现我的帖子无聊。我在混淆嵌套设计和重复度量设计。

站点提供了嵌套度量和重复度量设计之间差异的有用分解。有趣的是,作者显示了固定范围内固定的预期均值,固定范围内的随机数和随机范围内的随机数的期望均方值,但随机范围内的固定均值。很难想象这意味着什么-如果随机选择A级因素,则现在由随机性决定B级因素的选择。如果从校董会中随机选择5所学校,则3名教师从每个学校(教师嵌套在学校中)中选择“教师”因子的水平,现在是通过随机选择学校从校董会中随机选择的教师。我无法“固定”实验中要拥有的老师。


2
+1,非常感谢。您的回答对我来说都是有意义的。但是,我认为我们应该同意,“嵌套”一词的使用有两种不同的含义,这会引起混乱。@RobertLong说,当B的每个级别出现时,A嵌套在B中,而不同级别的AEg类嵌套在城镇中嵌套的学校中。在您的示例中,主体嵌套在治疗/控制因素中。您说时间是嵌套在主题中的,但是所有主题都发生了所有级别的时间,因此罗伯特会说它们被交叉了!这是一个不同的“嵌套”。对?
变形虫说莫妮卡(Monica)恢复

1
在您的示例中,很明显,时间和治疗是固定的,但距离患者内部的时间却遥遥无期。请您提供“嵌套”的定义吗?
乔·金

我的错。我在混淆嵌套和重复措施。我改变了答案-再次!
Placidia

实际上,我很喜欢您今天的原始答案,并提供了今天早些时候的更正/补充。对于我的问题,有很多有用的信息,因为如您所见,我实际上对这里的“重复措施”感兴趣(而关于“嵌套”的问题只是一个术语点)。我建议您保留以前的修订!
变形虫说恢复莫妮卡

2
在撰写本文时,我意识到重复测量中的随机效应是嵌套的,我想测试数学的计算方式和自由度。当我确定要钉上钉子时,我会放大我的答案!
Placidia
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.