GLM中的过度分散测试实际上是否“有用”?


15

每当我们使用限制响应变量方差的模型时,就会在GLM中出现“过度分散”现象,并且数据显示的方差大于模型限制所允许的方差。在使用Poisson GLM对计数数据进行建模时,通常会发生这种情况,并且可以通过众所周知的测试进行诊断。如果测试表明存在统计学上显着的过度分散迹象,那么我们通常通过使用更广泛的分布族来概括模型,该分布族将方差参数从原始模型下出现的约束中解脱出来。对于Poisson GLM,通常将其推广为负二项式或准Poisson GLM。

这种情况怀有明显的异议。为什么要从Poisson GLM开始呢?可以直接从较宽的分布形式开始,后者具有(相对)自由的方差参数,并允许方差参数适合数据,而完全忽略了过度分散测试。在其他情况下,当我们进行数据分析时,我们几乎总是使用至少允许前两个时刻自由的分布形式,那么为什么在这里例外?

我的问题:是否有充分的理由从确定方差的分布(例如泊松分布)开始,然后执行过度分散测试?与完全跳过本练习并直接转到更通用的模型(例如,负二项式,准泊松等)相比,此过程如何?换句话说,为什么不总是使用带有自由方差参数的分布呢?


1
我的猜测是,如果基础确实是泊松,那么您的glm结果将不会显示那些众所周知的良好属性,例如估计值在估计值的方差大于需要的情况下也是有效的(如果正确)模型已被使用。估计可能甚至没有偏见或MLE。但这只是我的直觉,我可能是错的。我很好奇答案是什么。
mlofton

3
以我的经验,过度分散测试(自相矛盾)主要是在您知道(从数据生成过程的知识)不能出现过度分散时使用。在这种情况下,过度分散测试可以告诉您线性模型是否正在拾取数据中的所有信号。如果不是,则应考虑向模型添加更多协变量。如果是这样,那么更多的协变量将无济于事。
Gordon Smyth

@GordonSmyth:我认为这是一个很好的答案。如果您不想将其转化为自己的答案,我将其折叠为我的答案。
Cliff AB

1
@GordonSmyth总是让我感到困扰的是,将偏差分析作为拟合优度的一项分析:协变量缺失与过度分散相混淆。它提出了一些有关如何经常教授材料的问题。我教的是分类课程,而教科书并没有很好地说明这一点。
家伙

1
@guy是的,这是正确的,人们倾向于认为残留偏差始终是卡方分布的,而通常不是。我们试图在最近的教科书doi.org/10.1007/978-1-4419-0118-7中更好地解决这些问题,但是很难涵盖所有空间限制内的内容。
Gordon Smyth

Answers:


14

原则上,我实际上同意99%的时间,最好只使用更灵活的模型。话虽如此,这里有两个半的论点说明了为什么不这样做。

(1)灵活性降低意味着估算效率更高。鉴于方差参数往往比平均参数不稳定,您对固定均值-方差关系的假设可能会使标准误差更加稳定。

(2)模型检查。我与物理学家合作,他们相信由于理论物理学的原因,各种测量结果都可以用泊松分布来描述。如果我们拒绝均值=方差的假设,那么我们就有反对泊松分布假设的证据。正如@GordonSmyth在评论中所指出的那样,如果您有理由相信给定的度量遵循泊松分布,则如果您有过度分散的证据,则有证据表明您缺少重要因素。

(2.5)正确分配。虽然负二项式回归来自有效的统计分布,但据我了解,拟泊松并非如此。这意味着你不能真正模拟计数数据,如果你相信V一种[R[ÿ]=αË[ÿ]对于α1。对于某些用例,这可能会很烦人。同样,您不能使用概率测试异常值等。


在2.5上:当然,负二项式和GLMM具有不受此限制的随机效应。
比约恩

@Björn:这就是为什么它只是争论的一半;仅适用于拟似然法。据我所知,尚无基于可能性的色散不足方法,即使可以使用拟似然模型进行分析。
悬崖AB

1
同样在2.5:我的理解是,没有指数色散族满足期望的关系。意思是,准分数与真实分数不符。这并不意味着有没有为满足期望的关系计数数据分布的家庭; 应该有很多这样的家庭。
家伙

2
@CliffAB用于分散计数数据,这是Conway-Maxwell-Poisson模型:en.m.wikipedia.org/wiki/…是在几个R包中实现的。
Dimitris Rizopoulos

如果将模型用于预测,那么偏爱简单模型的另一个原因是,如果其他所有条件都相等,则简单模型将具有更好的预测质量。我总体上在考虑AIC,BIC和PAC。
meh

11

尽管这是我自己的问题,但我还将发布自己的2美分作为答案,以便我们增加对此问题的看法。这里的问题是,最初将单参数分布拟合到数据是否明智。当使用单参数分布时(例如泊松GLM或具有固定试验参数的二项式GLM),方差不是自由参数,而是被约束为均值的某些函数。这意味着在任何情况下,如果您不能绝对确定方差遵循该分布的结构,就不宜将单参数分布拟合到数据。


将单参数分布拟合到数据几乎总是一个坏主意:数据通常比所提议的模型更混乱,并且即使有理论上的理由相信可以获得特定的单参数模型,数据也常常如此实际上来自该单参数分布与一系​​列参数值的混合。这通常等同于更广泛的模型,例如允许更大差异自由的两参数分布。如下所述,对于计数数据而言,这对于Poisson GLM是正确的。

如问题中所述,在大多数统计应用中,通常的做法是使用至少允许前两个时刻自由变化的分布形式。这确保了拟合模型允许数据指示推断的均值和方差,而不是由模型人为地约束这些值和方差。具有第二个参数只会在模型中失去一个自由度,与允许从数据估算方差的好处相比,这是一个很小的损失。当然,可以扩展这种推理,并添加第三个参数以允许偏斜度,第四个参数以允许峰度拟合,等等。


除极少数例外外,泊松GLM是一个不好的模型:以我的经验,拟合泊松分布以对数据进行计数几乎总是一个坏主意。对于计数数据,相对于泊松分布而言,数据的方差“过度分散”是非常普遍的。即使在理论指向泊松分布的情况下,最佳模型通常也是泊松分布的混合,其中方差成为自由参数。实际上,在计数数据的情况下,负二项式分布是速率参数的伽马分布泊松混合,因此即使有理论上的理由认为计数是根据泊松分布的过程到达的,通常也存在“过度分散”且负二项式分布拟合得更好的情况。

将Poisson GLM拟合以对数据进行计数,然后进行统计测试以检查“过度分散”的做法是不合时宜的,几乎从来都不是一种好的做法。在其他形式的统计分析中,我们不是从两参数分布开始,而是任意选择方差限制,然后测试此限制以尝试从分布中消除参数。通过这种方式,我们实际上创建了一个笨拙的混合过程,包括用于模型选择的初始假设检验,然后是实际模型(泊松或更广泛的分布)。在许多情况下,已经表明,从初始模型选择测试创建混合模型的这种做法会导致不良的整体模型。

在均差的T检验中,使用了类似的混合方法的类似情况。过去的情况是,统计学课程会建议首先使用Levene检验(甚至只是一些更糟糕的“经验法则”)来检查两个总体之间的方差是否相等,然后如果数据“通过”此检验,您将使用假设方差相等的学生T检验,如果数据“未通过”检验,则应改用Welch的T检验。这实际上是一个非常糟糕的过程(例如,请参见此处此处))。最好只使用后一种检验,该检验不对方差做任何假设,而不是创建一个笨拙的复合检验,该检验将初步的假设检验卡在一起,然后使用该检验来选择模型。

对于计数数据,通常可以通过拟合两参数模型(例如负二项式或准泊松模型)来获得良好的初始结果。(请注意,后者不是真实的分布,但是它仍然提供了合理的两参数模型。)如果根本不需要任何进一步的概括,通常是零通货膨胀的附加,其中零的数量过多在数据中。限制使用Poisson GLM是一种人为的,毫无意义的模型选择,并且通过过度分散测试并不能使其变得更好。


好的,这是一些次要例外:上面唯一的实际例外是两种情况:

(1)您有极强的先验理论基础,可以相信满足一个参数分布的假设,并且部分分析是针对数据测试该理论模型;要么

(2)由于某些其他(奇怪的)原因,分析的目的是对数据的方差进行假设检验,因此您实际上想将此方差限制在此假设的限制范围内,然后测试该假设。

这些情况非常罕见。它们往往仅在对数据生成机制具有很强的先验理论知识时才会出现,而分析的目的是检验这一基础理论。在严格控制的条件下(例如,在物理条件下)生成数据的应用范围极其有限的情况下可能就是这种情况。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.