Answers:
的问世广义线性模型,使我们对数据的积累回归款型当响应变量的分布是不正常的-例如,当你的DV是二元的。(如果您想了解有关GLiM的更多信息,我在这里写了一个相当广泛的答案,尽管上下文有所不同,这可能还是有用的。)但是,GLiM(例如,逻辑回归模型)假设您的数据是独立的。例如,想象一下一项研究,看孩子是否患有哮喘。每个孩子贡献一个数据指向该研究-他们患有哮喘或没有哮喘。但是,有时数据不是独立的。考虑另一项研究,该研究研究孩子在学年中各个时间是否感冒。在这种情况下,每个孩子贡献许多数据点。有时一个孩子可能会感冒,后来可能没有,而后来又可能又感冒了。这些数据不是独立的,因为它们来自同一个孩子。为了适当地分析这些数据,我们需要以某种方式考虑这种非独立性。有两种方法:一种方法是使用广义估计方程式(您没有提到,因此我们将跳过)。另一种方法是使用广义线性混合模型。GLiMM可以通过添加随机效应来解决非独立性问题(如@MichaelChernick所述)。因此,答案是您的第二个选择是用于非常规重复测量(或非独立)数据。(我要提一下@Macro的评论,广义线性混合模型作为特殊情况包括线性模型,因此可以与正态分布数据一起使用。但是,在典型用法中,该术语表示非正态数据。)
更新: (OP也询问了GEE,所以我将写一点关于这三个如何相互联系的信息。)
以下是基本概述:
由于每个参与者有多个试验,因此您的数据不是独立的;正如您正确指出的那样,“一位参与者中的[t]婚姻可能比整个参与者中的婚姻更相似”。因此,您应该使用GLMM或GEE。
然后,问题是如何选择GLMM还是GEE更适合您的情况。这个问题的答案取决于您的研究主题-具体来说,就是您希望做出的推断的目标。如前所述,对于GLMM,beta可以告诉您有关协变量一个单位变化对特定参与者的影响,因为它们具有各自的特征。另一方面,使用GEE,β告诉您协变量单位变化对整个相关人群的平均响应的影响。这是很难理解的区别,尤其是因为线性模型没有这种区别(在这种情况下,两者是同一件事)。
您应该使用GLMM还是GEE的问题是您要估计这些功能中的哪个功能。如果您想了解给定学生通过的可能性(例如,您是该学生还是该学生的父母),则需要使用GLMM。另一方面,如果您想了解对人口的影响(例如,如果您是老师或校长),则需要使用GEE。
有关此材料的另一个数学上更详细的讨论,请参阅@Macro的答案。
关键是引入随机效应。龚的链接提到了这一点。但是我认为应该直接提到它。那是主要的区别。
我建议您也检查一下我之前提出的问题的答案: