我将基于模型的标准错误与健壮的标准错误称为“ GEE”(实际上是可互换的定义),以区分分析。除了Scortchi出色的解释之外:
GEE可以在小样本(即10至50个受试者)中“偏向”:(Lipsitz,Laird和Harrington,1990年; Emrich和Piedmonte,1992年; Sharples和Breslow,1992年; Lipsitz等人,1994年; Qu,Piedmonte和Williams,1994年; Gunsolley,Getchell和Chinchilli,1995年; Sherman和le Cessie,1997年。)当我说GEE偏差时,我的意思是,由于细胞计数少或为零,标准误差估计可以是保守的也可以是保守的。 ,取决于哪些拟合值表现出此行为以及它们与回归模型的整体趋势的一致性。
通常,正确指定参数模型后,您仍然可以从基于模型的CI中获得正确的标准误差估计值,但是使用GEE的全部目的是要适应很大的“ if”。GEE允许统计人员仅指定数据的工作概率模型,并且参数(而不是在严格的参数框架中进行解释)被认为是一种“筛子”,可以生成可重复的值,而与潜在的未知数据生成无关机制。这是半参数分析的核心,而GEE就是其中的一个例子。
即使指定了独立的相关矩阵,GEE也会处理数据中未测的协方差源。这是因为使用了经验而不是基于模型的协方差矩阵。例如,在泊松建模中,您可能会对从各种溪流中采样的鲑鱼的繁殖率感兴趣。从雌性鱼类中收获的卵可能具有潜在的泊松分布,但是遗传变异包括共同的可遗传性和特定流中的可用资源,可能使这些流中的鱼比其他流中的鱼更相似。只要采样率与其人口比例一致(或以其他方式分层),GEE就会给出正确的人口标准误差估计。