2
GLM中的过度分散测试实际上是否“有用”?
每当我们使用限制响应变量方差的模型时,就会在GLM中出现“过度分散”现象,并且数据显示的方差大于模型限制所允许的方差。在使用Poisson GLM对计数数据进行建模时,通常会发生这种情况,并且可以通过众所周知的测试进行诊断。如果测试表明存在统计学上显着的过度分散迹象,那么我们通常通过使用更广泛的分布族来概括模型,该分布族将方差参数从原始模型下出现的约束中解脱出来。对于Poisson GLM,通常将其推广为负二项式或准Poisson GLM。 这种情况怀有明显的异议。为什么要从Poisson GLM开始呢?可以直接从较宽的分布形式开始,后者具有(相对)自由的方差参数,并允许方差参数适合数据,而完全忽略了过度分散测试。在其他情况下,当我们进行数据分析时,我们几乎总是使用至少允许前两个时刻自由的分布形式,那么为什么在这里例外? 我的问题:是否有充分的理由从确定方差的分布(例如泊松分布)开始,然后执行过度分散测试?与完全跳过本练习并直接转到更通用的模型(例如,负二项式,准泊松等)相比,此过程如何?换句话说,为什么不总是使用带有自由方差参数的分布呢?