负二项式/泊松回归中的过度分散和分散不足


11

我在SAS中执行Poisson回归,发现Pearson卡方值除以自由度约为5,表明存在明显的过度分散。因此,我使用proc genmod拟合了负二项式模型,发现皮尔逊卡方值除以自由度是0.80。现在认为这是分散的吗?如果是这样,该如何处理呢?我已经阅读了很多有关过度分散的知识,并且相信我知道如何处理此问题,但是关于如何处理或确定是否存在分散不足的信息很少。有人可以协助吗?

谢谢。


Answers:


17

对于平均值为的泊松分布,方差也为。在广义线性模型的框架内,这意味着 对于泊松模型,方差函数为 。由于许多不同的原因,该模型假设可能是错误的。例如,经常会遇到方差大于Poisson分布所指示的方差过大的计数数据。 μμ

Vμ=μ

在回归上下文中,与方差假设的偏差可以采取几种形式。最简单的一个是方差函数等于 其中是离散参数。这是准泊松模型。它将给出相同的拟合回归模型,但是使用估计的色散参数针对过高或过低的色散调整统计推断(和置信区间)。

Vμ=ψμ
ψ>0p

方差函数的功能形式也可能是错误的。例如,它可能是二次多项式 。示例包括二项式,负二项式和伽玛模型。选择这些模型中的任何一个作为Poisson模型的替代品都会影响拟合的回归模型以及随后的统计推断。对于形状参数的负二项式分布,方差函数为 从中我们可以看到,如果我们将获得泊松分布的方差函数。

Vμ=一种μ2+bμ+C
λ>0
Vμ=μ1个+μλ
λ

为了确定Poisson模型的方差函数是否适合该数据,我们可以按照OP的建议估计色散参数,并检查它是否约为1(也许使用形式检验)。这样的测试并未提出具体的选择,但是在准泊松模型中最清楚地理解了这一点。要测试方差函数的函数形式是否合适,我们可以针对负二项式模型()构造泊松模型()的似然比检验。请注意,在原假设下,它具有非标准分布。或者,我们通常可以使用基于AIC的方法来比较非嵌套模型。泊松模型中基于回归的过度分散测试λ=λ< 探索了针对一般方差函数的一类测试。

但是,我建议首先研究残差图,例如Pearson或偏差残差(或其平方值)相对于拟合值的图。如果方差的函数形式不正确,您将在残差图中将其视为漏斗形状(或残差平方的趋势)。如果功能形式正确,即没有漏斗或趋势,则仍然可能存在过度分散或分散不足的情况,但这可以通过估计分散参数来解决。残差图的好处是,它比检验更清楚地表明方差函数出了什么问题(如果有的话)。

在OP的具体情况下,无法确定0.8是否表示从给定信息中分散不足。我建议不要着重于5和0.8的估计,首先建议研究Poisson模型和负二项式模型的方差函数的拟合。一旦确定了方差函数的最合适的函数形式,就可以在任一模型中包括一个弥散参数(如果需要),以针对任何其他过度弥散或欠弥散调整统计推断。不幸的是,如何在SAS中轻松地做到这一点并不是我可以帮助的。


2
+1,这是很好的一般信息。如果您专门解决OP的显式问题,可能对OP更有帮助:(1)分散不足.8;&(2)如果是,该如何处理。
gung-恢复莫妮卡

@gung,我已经编辑了答案以提供更具体的建议。您无法根据可用信息确定0.8是否显着小于1,并且恕我直言,专注于分散参数是否为1是转移。我的编辑解释了我认为OP应该重点关注的内容。
NRH
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.