如果您有兴趣发现协变量的总体平均效果与个人具体效果,请使用GEE。这两件事仅在线性模型中等效,而在非线性模型中(例如逻辑模型)则等效。为了看到这一点,例如,采用第个主题的第个观测值的随机效应逻辑模型;jiYij
log(pij1−pij)=μ+ηi
其中是对象的随机效应,。ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
如果对这些数据使用随机效应模型,则将得到的估计值,这说明了对每个个体应用均值零正态分布扰动的事实,从而使其成为特定个体。μ
如果对这些数据使用GEE,则可以估算出总体平均对数优势。在这种情况下
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ。例如,如果且,则。尽管随机效应在转换后的(或链接的)尺度上均值为零,但在原始数据尺度上其效果并非均值零。尝试从混合效应逻辑回归模型中模拟一些数据,并将总体平均水平与截距的逆对数进行比较,您将看到它们是不相等的,如本例所示。系数解释的差异是GEE和随机效应模型之间的根本差异。μ=1σ2=1ν≈.83
编辑:通常,没有预测变量的混合效应模型可以写成
ψ(E(Yij|ηi))=μ+ηi
其中是链接函数。每当ψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
总体平均系数(GEE)与个体特定系数(随机效应模型)之间会有差异。也就是说,平均值通过转换数据,对转换后的尺度上的随机效应进行积分,然后转换回来改变。请注意,在线性模型中(即),等式确实成立,因此它们是等效的。ψ(x)=x
编辑2:值得注意的是,即使模型中未指定相关结构,GEE模型产生的“稳健”三明治型标准误差也提供了有效的渐近置信区间(例如,它们实际上覆盖了95%的时间)。正确。
编辑3:如果您的兴趣是了解数据中的关联结构,则GEE关联估计估计效率极低(有时是不一致的)。我已经看到了对此的参考,但是现在无法放置。