恐怕我可能会有一个细微而又可能不令人满意的答案,即这是研究人员或数据分析师的主观选择。正如该线程中其他地方提到的那样,仅仅说数据具有“嵌套结构”是不够的。公平地说,这是多少本书描述何时使用多层模型。例如,我刚刚从我的书架上摘下了Joop Hox的书《多级分析》,它给出了以下定义:
一个多层次的问题涉及具有层次结构的人口。
即使在一本非常好的教科书中,最初的定义似乎也是循环的。我认为部分原因是确定何时使用哪种模型(包括多层次模型)的主观性。
另一本名为West,Welch和Galecki的线性混合模型的书说,这些模型适用于:
结果变量,其中残差呈正态分布,但可能不是独立的或具有恒定的方差。导致可以使用LMM进行适当分析的数据集的研究设计包括(1)包含群集数据的研究(例如教室中的学生)或带有随机块的实验设计(例如用于工业过程的原料批次),以及(2)纵向或重复测量研究,其中随时间或在不同条件下反复测量对象。
Finch,Bolin和Kelley的R中的多级建模还讨论了违反iid假设和相关残差的问题:
在多级建模的情况下,特别重要的是[在标准回归中]假设样本中各个观察值的独立分布误差项。该假设实质上意味着,一旦考虑了分析中的自变量,则因变量在样本中的个体之间就没有关系。
我认为,当有理由相信观察不一定彼此独立时,多层次模型才有意义。可以解释导致这种非独立性的任何“集群”。
一个明显的例子是教室里的孩子们,他们都互相影响,这可能导致他们的考试成绩不是独立的。如果一个教室里有人问一个问题,导致该课程涵盖了其他班级未涵盖的材料怎么办?如果老师在某些班级比其他班级更清醒怎么办?在这种情况下,数据将存在一些非独立性;用多级词来说,我们可以预期因变量的某些差异是由于聚类(即类)引起的。
我认为,关于狗与大象的例子取决于感兴趣的独立变量和因变量。例如,假设我们要问咖啡因对活动水平是否有影响。动物园各处的动物都被随机分配以获得含咖啡因的饮料或对照饮料。
如果我们是对咖啡因感兴趣的研究人员,则可以指定一个多级模型,因为我们确实关心咖啡因的作用。该模型将指定为:
activity ~ condition + (1+condition|species)
如果存在大量我们正在检验该假设的物种,这将特别有用。但是,研究人员可能对咖啡因的物种特异性作用感兴趣。在这种情况下,他们可以将物种指定为固定效果:
activity ~ condition + species + condition*species
如果存在(例如)30个物种,那么创建一个笨拙的2 x 30设计显然是一个问题。但是,您可以在如何建模这些关系方面变得很有创意。
例如,一些研究人员认为更广泛地使用多级建模。Gelman,Hill,&Yajima(2012)认为,多级建模可以用作多重比较的校正-即使在实验研究中,数据的结构在本质上显然不是分层的:
在对具有更多结构的多个比较进行建模时会出现更棘手的问题。例如,假设我们有五个结果指标,三种治疗方法以及按两个性别和四个种族分组的亚组。我们不想将此2×3×4×5结构建模为120个可交换组。即使在这些更复杂的情况下,我们认为多层建模也应该并且将最终取代经典的多重比较程序。
可以用各种方式对问题进行建模,在模棱两可的情况下,多种方法似乎很有吸引力。我认为我们的工作是选择一种合理的,知情的方法并透明地这样做。