我是一名流行病学家,试图了解GEE,以便正确地分析队列研究(使用带有对数链接的Poisson回归来估计相对风险)。我有一些关于“工作相关性”的问题,希望有更多知识的人来澄清:
(1)如果我在同一个人中进行过多次测量,通常假设采用可交换结构最合理吗?(如果测量结果显示趋势,则为自回归)?独立性又如何?在任何情况下,都可以假设同一个人的测量具有独立性?
(2)是否有(合理简单)的方法通过检查数据来评估适当的结构?
(3)我注意到,当选择一个独立结构时,与运行简单的泊松回归(使用R,函数glm()
和geeglm()
from package geepack
)得到的点估计(但标准误较低)相同。为什么会这样呢?我了解,使用GEE,您可以估算总体平均模型(与特定主题不同),因此,仅在线性回归情况下,您应该获得相同的点估算。
(4)如果我的队列位于多个位置(但每个人一个度量),我应该选择独立性还是可交换的工作关联,为什么?我的意思是,每个站点中的个人仍然彼此独立,对吗?因此,例如,对于特定于对象的模型,我会将站点指定为随机效果。但是,对于GEE,独立性和可交换性给出了不同的估计,我不确定就基础假设而言哪个更好。
(5)GEE是否可以处理2级分层聚类,即每个人重复测量的多站点队列?如果是,我应该在中指定什么作为聚类变量,geeglm()
并且如果假设第一层(站点)为“独立”,第二层(个体)为“可交换”或“自回归”,则工作相关性应该是什么?
我了解这些问题相当多,其中一些问题可能是相当基本的,但对于我(也许还有其他新手?)来说仍然很难解决。因此,我们非常感谢您提供的任何帮助,为此,我开始提供赏金。