什么时候使用混合效果模型?


11

线性混合效应模型是线性回归模型的扩展,用于分组收集和汇总的数据。关键优势在于系数可以相对于一个或多个组变量而变化。

但是,我在何时使用混合效果模型方面感到困惑我将通过在极端情况下使用玩具示例来阐述我的问题。

假设我们要为动物的身高和体重建模,并使用物种作为分组变量。

  • 如果不同的群体/物种真的不同。说一只狗和大象。我认为没有必要使用混合效果模型,我们应该为每个小组建立一个模型。

  • 如果不同的群体/物种真的很相似。说一只母狗和一只公狗。我认为我们可能希望将性别用作模型中的分类变量。

因此,我假设我们应该在中间情况下使用混合效果模型?可以说,该组是猫,狗,兔子,它们是大小相似的动物,但不同。

是否有任何正式的论据来建议何时使用混合效果模型,即如何在

  1. 为每个小组建立模型
  2. 混合效应模型
  3. 将组用作回归中的分类变量

我的尝试:方法1是最“复杂的模型” /更少的自由度,方法3是最“简单的模型” /更大的自由度。混合效果模型位于中间。我们可能会考虑根据Bais Variance Trade Off选择正确模型所需的数据量和复杂度。


5
这个论坛上的许多主题都对此进行了讨论。您搜寻了吗?请注意,带有“分类变量”的选项称为“固定效果”(分组变量),而“使用混合模型”的意思是“随机效果”。因此,您要问的是何时使用固定效果以及何时使用随机效果。关于这个问题有各种各样的意见,您可以在这里找到很多关于简历的讨论。我可能会在以后发布一些链接。
amoeba

另外,“建立单独的模型”和“使用分类变量”之间的区别对我来说也不清楚。activity ~ condition + species + condition*species-它species用作分类变量,但这完全等同activity ~ condition于每个物种的单独回归。
amoeba

2
检查以下线程:stats.stackexchange.com/questions/120964/…,它不会直接回答您的问题,但是会提供与您的问题密切相关的讨论。
蒂姆

3
好吧,您是否已开始阅读stats.stackexchange.com/a/151800/28666
amoeba

2
“如果不同的群体/物种真的不同。比如说一只狗和大象。我认为没有必要使用混合效应模型,我们应该为每个群体建立一个模型。” 仅当您期望所有其他功能的效果因物种而异时,这才真正成立。在大多数情况下,这是一个过于宽松的假设。
马修·德鲁里

Answers:


8

恐怕我可能会有一个细微而又可能不令人满意的答案,即这是研究人员或数据分析师的主观选择。正如该线程中其他地方提到的那样,仅仅说数据具有“嵌套结构”是不够的。公平地说,这是多少本书描述何时使用多层模型。例如,我刚刚从我的书架上摘下了Joop Hox的书《多级分析》,它给出了以下定义:

一个多层次的问题涉及具有层次结构的人口。

即使在一本非常好的教科书中,最初的定义似乎也是循环的。我认为部分原因是确定何时使用哪种模型(包括多层次模型)的主观性。

另一本名为West,Welch和Galecki的线性混合模型的书说,这些模型适用于:

结果变量,其中残差呈正态分布,但可能不是独立的或具有恒定的方差。导致可以使用LMM进行适当分析的数据集的研究设计包括(1)包含群集数据的研究(例如教室中的学生)或带有随机块的实验设计(例如用于工业过程的原料批次),以及(2)纵向或重复测量研究,其中随时间或在不同条件下反复测量对象。

Finch,Bolin和Kelley的R中多级建模还讨论了违反iid假设和相关残差的问题:

在多级建模的情况下,特别重要的是[在标准回归中]假设样本中各个观察值的独立分布误差项。该假设实质上意味着,一旦考虑了分析中的自变量,则因变量在样本中的个体之间就没有关系。

我认为,当有理由相信观察不一定彼此独立时,多层次模型才有意义。可以解释导致这种非独立性的任何“集群”。

一个明显的例子是教室里的孩子们,他们都互相影响,这可能导致他们的考试成绩不是独立的。如果一个教室里有人问一个问题,导致该课程涵盖了其他班级未涵盖的材料怎么办?如果老师在某些班级比其他班级更清醒怎么办?在这种情况下,数据将存在一些非独立性;用多级词来说,我们可以预期因变量的某些差异是由于聚类(即类)引起的。

我认为,关于狗与大象的例子取决于感兴趣的独立变量和因变量。例如,假设我们要问咖啡因对活动水平是否有影响。动物园各处的动物都被随机分配以获得含咖啡因的饮料或对照饮料。

如果我们是对咖啡因感兴趣的研究人员,则可以指定一个多级模型,因为我们确实关心咖啡因的作用。该模型将指定为:

activity ~ condition + (1+condition|species)

如果存在大量我们正在检验该假设的物种,这将特别有用。但是,研究人员可能对咖啡因的物种特异性作用感兴趣。在这种情况下,他们可以将物种指定为固定效果:

activity ~ condition + species + condition*species

如果存在(例如)30个物种,那么创建一个笨拙的2 x 30设计显然是一个问题。但是,您可以在如何建模这些关系方面变得很有创意。

例如,一些研究人员认为更广泛地使用多级建模。Gelman,Hill,&Yajima(2012)认为,多级建模可以用作多重比较的校正-即使在实验研究中,数据的结构在本质上显然不是分层的:

在对具有更多结构的多个比较进行建模时会出现更棘手的问题。例如,假设我们有五个结果指标,三种治疗方法以及按两个性别和四个种族分组的亚组。我们不想将此2×3×4×5结构建模为120个可交换组。即使在这些更复杂的情况下,我们认为多层建模也应该并且将最终取代经典的多重比较程序。

可以用各种方式对问题进行建模,在模棱两可的情况下,多种方法似乎很有吸引力。我认为我们的工作是选择一种合理的,知情的方法并透明地这样做。


5

您当然可以为每个不同的组建立模型,这没有错。但是,您需要更大的样本量,并且需要管理多个模型。

通过使用混合模型,您可以将数据汇总(共享)在一起,因此需要较小的样本量。

这样做,我们正在分享统计实力。这里的想法是,我们可以在一组数据中很好地推断出的东西可以帮助我们解决在另一组数据中不能很好地推断出的东西。

混合模型还可以防止过度采样的组不公正地支配推理。

我的观点是,如果要对基础的稍后层次结构进行建模,则应在模型中添加随机效果。否则,如果您不关心模型解释,就不要使用它。

https://www.dropbox.com/s/rzi2rsou6h817zz/Datascience%20Presentation.pdf?dl=0

进行相关讨论。作者讨论了为什么他不想运行单独的回归模型。

在此处输入图片说明


4

在混合效果模型中,您可以在模型中添加随机(误差)项,因此可以“混合”固定效果和随机效果。因此,考虑何时使用混合效应模型的另一种方法可能是查看什么是“随机效应”。因此,除了先前给出的答案外,我还从Bates(2010)指导性的第1.1节(特别是第2页)中发现了术语“固定”和“随机”效应之间的区别。

与协变量的特定级别关联的参数有时称为级别的“效果”。如果协变量的可能水平的集合是固定且可重现的,我们将使用固定效应参数对协变量建模。如果我们观察到的水平代表所有可能水平集中的随机样本,则 我们将随机效应纳入模型。关于固定效果参数和随机效果之间的区别,需要注意两件事。首先,名称具有误导性,因为固定和随机之间的区别更多是分类协变量级别的属性,而不是与它们相关的效果的属性。

此定义通常适用于某些层次结构,例如国家或教室,因为您始终具有国家或教室的“随机”样本-尚未从所有可能的国家或教室收集数据。

但是,性别是固定的(或至少被视为固定的)。如果您有男性或女性,则没有其他性别等级(可能会有一些性别例外,但这通常被忽略)。

或说教育水平:如果您问人们是处于低,中还是高等教育水平,那么就没有水平了,因此您没有对所有可能的教育水平进行“随机”抽样(因此,这是固定的结果)。


2
+1为什么投票失败?引用自一位受人尊敬的统计学家对随机效应建模的引用;下面的评论是相当直接的和明确的...
usεr11852

3

在基于研究设计可以做出一些合理假设的情况下,您可以使用混合模型,这些假设是关于观察推断之间的相关性的本质,需要在单个级别条件效应上进行。混合模型允许指定随机效应,这是在数据收集中自然出现的相关结构的方便表示。

混合模型的最常见类型是随机截距模型,该模型估计在数据集中识别的个体群集内具有0均值,有限方差正态分布的公共常数的潜在分布。这种方法潜在地解释了成百上千个观察因子或聚类所共有的混杂因素,但在聚类之间有所不同。

混合模型的第二种常见类型是随机斜率模型,类似于随机截距模型,它估计时间预测器交互作用的潜在分布,该分布又来自于面板研究或聚类中的0均值,有限方差正态分布前瞻性或纵向测量的观测值。

这些结果与使用广义最小二乘法和EM算法迭代估算模型参数以及这些从属观测值之间的协方差(或更确切地说,其残差)所获得的结果大致相似。当观测值之间的协方差已知时,加权最小二乘比最小二乘更有效。尽管协方差鲜为人知,但可以假定它采用了特定的结构并进行了迭代估算。随机截距模型对具有可交换相关结构的加权最小二乘给出相似的推论和可能性,如果,则Ý 1ÿ 2 Ç ø - [R Ý ÿ 小号= ρ | t s | Ÿ 牛逼ÿ 小号牛逼小号cor(Y1,Y2)=ρY1,Y2在同一群集中,否则为0。随机斜率模型对具有自回归1相关结构的加权最小二乘给出相似的推论和似然,其中如果是同一样本在不同时间观测值,则和0,否则。结果并不完全相同,因为随机截距迫使群集内的观测值呈正相关,这几乎总是一个合理的假设。cor(Yt,Ys)=ρ|ts|Yt,Yst,s

个人水平或条件效应可以与人口水平或边际效应形成对比。边际效应表示干预或筛查对人群的影响。例如,增加药物滥用康复依从性的一项干预措施可能是针对一组因各种情况而入院的患者进行3个月的出勤检查。使用的持续时间可能因患者而异,并强烈预测对讲习班的依从性,而使用时间更长的参与者会产生更大的成瘾倾向和回避。个体水平分析可能表明,尽管成瘾时间较长的参与者在接受干预之前没有参加,而在接受干预之后继续不参加,但这项研究是有效的。

由于忽略了时间或空间簇之间的同质性,边际效应的推论不太精确。可以使用广义估计方程或通过边缘化混合模型来估计它们。


2
+1,希望我能接受2个答案!我对@Mark答案的评论也适用于您的答案。您帮助我了解了我们如何定义“集群中的观测”
Du Haitao Du

2
@ hxd1011严格来自研究设计声明。具有分层样本或重复测量的任何设计都将具有非独立数据。统计测试不是这种情况。报告或至少检查随机效应可以帮助理解相关程度,ICC是这种度量的一个示例。
AdamO

0

当数据具有嵌套或层次结构时,应使用混合效果。实际上,这违反了测量独立性的假设,因为同一组/级别内的所有测量都是相关的。的情况下

“如果不同的群体/物种真的很相似。说一只雌狗和一只雄狗。我认为我们可能希望在模型中使用性别作为分类变量。”

性别将是因子变量和固定效应,而性别中狗大小的可变性是随机效应。我的模型是

response ~ sex + (1|size), data=data

凭直觉,由于狗和猫的大小不相关,因此应分别对兔子,狗和猫进行建模,但是两只狗的大小是一种“种内”变异性。


我个人认为“嵌套或层次结构”一词过于笼统,很难定义边界。
Haitao Du

也许你是对的。我猜想,由于数据中存在某种分组而违反了IID的假设时,将使用LMM。
marianess
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.