何时使用广义估计方程与混合效应模型?


63

我已经很高兴将混合效果模型用于纵向数据已有一段时间了。我希望我能适应lmer中的AR关系(我认为我做不到这一点是对的吗?),但我不认为这非常重要,因此我不必担心太多。

我刚刚遇到了广义估计方程(GEE),它们似乎比ME模型具有更大的灵活性。

冒着问一个笼统的问题的风险,是否有任何建议适合于不同的任务?我看过一些比较它们的论文,它们的形式通常是:

“在这个高度专业化的领域,不要将GEE用于X,不要将ME模型用于Y”。

我没有找到更多一般性建议。谁能启发我?

谢谢!


1
“它们似乎提供了更多的灵活性” ...嗯,它们的方法也有所不同,因为使用GEE来拟合边际分布,这与使用GLMM时通常感兴趣的条件方法相反。
chl


请注意,这glmmPQL也可以适合AR相关结构
Tom Wenseleers 2014年

什么是AR关系?
以示例方式学习统计数据(

@incodeveritas自回归协方差结构
Tommyixi

Answers:


56

如果您有兴趣发现协变量的总体平均效果与个人具体效果,请使用GEE。这两件事仅在线性模型中等效,而在非线性模型中(例如逻辑模型)则等效。为了看到这一点,例如,采用第个主题的第个观测值的随机效应逻辑模型;jiYij

log(pij1pij)=μ+ηi

其中是对象的随机效应,。ηiN(0,σ2)ipij=P(Yij=1|ηi)

如果对这些数据使用随机效应模型,则将得到的估计值,这说明了对每个个体应用均值零正态分布扰动的事实,从而使其成为特定个体。μ

如果对这些数据使用GEE,则可以估算出总体平均对数优势。在这种情况下

ν=log(Eη(11+eμηi)1Eη(11+eμηi))

νμ。例如,如果且,则。尽管随机效应在转换后的(或链接的)尺度上均值为零,但在原始数据尺度上其效果并非均值零。尝试从混合效应逻辑回归模型中模拟一些数据,并将总体平均水平与截距的逆对数进行比较,您将看到它们是不相等的,如本例所示。系数解释的差异是GEE和随机效应模型之间的根本差异μ=1σ2=1ν.83

编辑:通常,没有预测变量的混合效应模型可以写成

ψ(E(Yij|ηi))=μ+ηi

其中是链接函数。每当ψ

ψ(Eη(ψ1(E(Yij|ηi))))Eη(E(Yij|ηi))

总体平均系数(GEE)与个体特定系数(随机效应模型)之间会有差异。也就是说,平均值通过转换数据,对转换后的尺度上的随机效应进行积分,然后转换回来改变。请注意,在线性模型中(即),等式确实成立,因此它们是等效的。ψ(x)=x

编辑2:值得注意的是,即使模型中未指定相关结构,GEE模型产生的“稳健”三明治型标准误差也提供了有效的渐近置信区间(例如,它们实际上覆盖了95%的时间)。正确。

编辑3:如果您的兴趣是了解数据中的关联结构,则GEE关联估计估计效率极低(有时是不一致的)。我已经看到了对此的参考,但是现在无法放置。


3
(+1)关于您的第二次编辑,我要补充一点,基于模型的方差估计量将在少数聚类中更好地工作(或者我们可以使用Jacknife估计量)。作为参考,我总是指向gbi.agrsci.dk/statistics/courses/phd07/material/Day10,其中包含非常不错的讲义(统计背景,包括GEE与GLMM方法的比较+ R中的插图) 。
chl

哇,真是个好答案。非常感谢。那就是我一直在寻找的东西。还要感谢chl的链接。你们俩都拥有+10互联网。
克里斯·比利

GEE是否还不认为较高级别的影响是令人讨厌的参数?在我看来,这是另一个重要的区别-如果有人对这些效果感兴趣,那么GEE不会将其提供给您。另外,如果您不满意这些分布假设,那么GEE可能会更可取。
robin.datadrivers 2014年

@chl提供的链接已经死了:/(六年后是可以预料的,对吗?)
Guilherme Marthe

@GuilhermeMarthe好抓住!不幸的是,我在另一个线程中链接了相同的材料。我看到两个选项:引用geepack R包(由同一两位作者开发)或暂时使用WayBack Machine
chl

10

当我们不使用贝叶斯建模以及没有完全似然解决方案时,我认为GEE最有用。同样,GEE可能需要更大的样本量才能足够准确,并且对于非随机丢失的纵向数据也非常不可靠。GEE假定完全随机丢失,而似然方法(例如混合效应模型或广义最小二乘)假定仅随机丢失。


1

您可以在Fitzmaurice,Laird和Ware的《应用纵向分析》(John Wiley&Sons,2011年,第二版,第11-16章)中找到详尽的讨论和具体示例。

对于示例,您可以在配套网站上找到数据集和SAS / Stata / R程序。


2
您能总结一下本书的要点吗?
chl 2014年

2
我想说Macro已经做到了;-)在书中,您可以找到更长,更详细的讨论,一些分析,数值和图形示例,以及其他一些要点,其中包括Frank Harrell所添加的内容。您还可以查看Gelman的博客
塞尔吉奥2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.