广义估计方程和GLMM有什么区别?


27

我正在使用logit链接在3级不平衡数据上运行GEE。这与混合效果(GLMM)和logit链接的GLM有什么不同(就我得出的结论和系数的含义而言)?

更多详细信息:观察结果是单次bernoulli试验。它们分为教室和学校。使用R。按需省略NA。6个预测变量也包括交互项。

(我不是要让孩子们抬头看他们是否抬头。)

我倾向于对系数进行比对。两者的含义是否相同?

关于GEE模型中的“边际均值”,我的内心深处潜藏着一些东西。我需要向我解释一下。

谢谢。


Answers:


44

就系数的解释而言,二进制情况(以及其他情况)有所不同。GEE和GLMM之间的区别是推理目标:总体平均特定主题

让我们考虑一个与您的示例有关的简单示例。您要模拟学校中男孩和女孩之间的失效率。与大多数(小学)学校一样,学生人数被划分为教室。你观察二元响应从儿童教室(即通过课堂聚集二进制响应),其中,如果学生从课堂上通过如果失败,则。和如果学生从教室是男,否则为0。YniNi=1NniYij=1jiYij=0xij=1ji

引入我在第一段中使用的术语,您可以认为学校是人口,教室是主题

首先考虑GLMM。GLMM正在拟合混合效应模型。固定设计矩阵上的模型条件(在这种情况下,该矩阵包括性别的截距和指标)以及模型中包含的教室之间的任何随机效应。在我们的示例中,让我们包括一个随机截距,该截距将考虑教室之间的故障率的基线差异。所以我们正在建模bi

log(P(Yij=1)P(Yij=0)xij,bi)=β0+β1xij+bi

在上述模型中,失败风险的优势比基于的值而不同,而的值在教室之间是不同的。因此,估计是针对特定学科的bi

另一方面,GEE正在拟合边际模型。这些模型人口平均数。您仅在固定设计矩阵上对期望进行建模。

log(P(Yij=1)P(Yij=0)xij)=β0+β1xij

这与如上所述的混合效果模型相反,该模型在固定设计矩阵和随机效果上都具有条件​​。因此,在上面的边际模型中,您说的是:“忘记教室之间的差异,我只希望人口(学校方面)的失效率及其与性别的关系。” 您拟合模型并获得比值比率,该比值比率是与性别相关的失败的总体平均比值比率。

因此,您可能会发现GEE模型中的估算值与GLMM模型中的估算值可能不同,这是因为它们不是在估算同一件事。

(关于通过对数从对数比值比转换为比值比,是的,无论是人口级别还是特定主题的估计,您都可以这样做)

一些注释/文献:

对于线性情况,总体平均和特定主题的估计是相同的。

Zeger等。1988年表明,对于逻辑回归,

βM[(16315π)2V+1]1/2βRE

其中是边缘估计,是特定对象的估计,是随机效应的方差。βMβREV

Molenberghs(Verbeke,2005年)整整论述了边际效应模型与随机效应模型。

我是从Diggle,Heagerty,Liang,Zeger 2002(非常有参考价值)的一门课程中学习到此内容和相关材料的。


1
迈克:说GEE对随机效应求平均值是否过于简单?
B_Miner

3
@B_Miner根本不是太简单,这就是您正在做的事情:)

3
@Mike Wierzbicki:好的答案,Mike!我可能会在“某些注释/文献”中添加一个小细节:仅当为GEE指定可交换的相关矩阵时,GEE和GLMM在线性情况下(高斯响应,身份链接)是相同的。

也没有特定学科的GEE吗?
佐丹奴

@MikeWierzbicki因此,如果我对您的理解正确,那么GEE就是无随机效应的简单混合效应模型(从而使其成为简单的非线性回归线)?
罗宾·克雷默
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.