可能会有更好,更详细的答案,但是我可以给您一些简单,快速的想法。看来您正在谈论使用广义线性模型(例如,典型的逻辑回归)来拟合在多个时间点从某些主题收集的数据。乍一看,我发现这种方法存在两个明显的问题。
首先,该模型假定给定协变量,您的数据是独立的(也就是说,在考虑了每个对象的伪代码之后,类似于一个单独的拦截项,并且每个人的线性时间趋势都相等)。这几乎是不可能的。相反,几乎肯定会存在自相关,例如,即使在考虑了时间之后,对时间更近的同一个人的两个观察也会比时间相距较远的两个观察更相似。(尽管如果您还包括subject ID x time
交互作用,也就是每个人都有独特的时间趋势,尽管它们很可能是独立的,但这会加剧下一个问题。)
其次,您将消耗大量的自由度来估计每个参与者的参数。您可能还剩下相对较少的自由度,可以用来准确估计您感兴趣的参数(当然,这取决于您每个人进行了多少次测量)。
具有讽刺意味的是,第一个问题意味着您的置信区间太窄,而第二个问题意味着您的配置项将比如果您没有浪费大多数自由度的情况下要宽得多。但是,我不会指望这两者相互抵消。对于它的价值,我相信您的参数估计将是无偏的(尽管我在这里可能是错误的)。
在这种情况下,使用广义估计方程是合适的。当您使用适合GEE模型,您指定的相关性结构(如AR(1)),它可以是相当合理的,你的数据是独立的条件上双方的协变量和您所指定的相关矩阵。此外,GEE估计总体均值关联,因此您不必为每个参与者消耗一定的自由度-本质上,您需要对它们进行平均。
据我所知,在两种情况下,解释都是一样的:假设其他因素保持不变,则X3的一个单位变化与B3的“成功”对数赔率相关。