Answers:
对于平均值为的泊松分布,方差也为。在广义线性模型的框架内,这意味着 对于泊松模型,方差函数为 。由于许多不同的原因,该模型假设可能是错误的。例如,经常会遇到方差大于Poisson分布所指示的方差过大的计数数据。
在回归上下文中,与方差假设的偏差可以采取几种形式。最简单的一个是方差函数等于 其中是离散参数。这是准泊松模型。它将给出相同的拟合回归模型,但是使用估计的色散参数针对过高或过低的色散调整统计推断(和置信区间)。
方差函数的功能形式也可能是错误的。例如,它可能是二次多项式 。示例包括二项式,负二项式和伽玛模型。选择这些模型中的任何一个作为Poisson模型的替代品都会影响拟合的回归模型以及随后的统计推断。对于形状参数的负二项式分布,方差函数为 从中我们可以看到,如果我们将获得泊松分布的方差函数。
为了确定Poisson模型的方差函数是否适合该数据,我们可以按照OP的建议估计色散参数,并检查它是否约为1(也许使用形式检验)。这样的测试并未提出具体的选择,但是在准泊松模型中最清楚地理解了这一点。要测试方差函数的函数形式是否合适,我们可以针对负二项式模型()构造泊松模型()的似然比检验。请注意,在原假设下,它具有非标准分布。或者,我们通常可以使用基于AIC的方法来比较非嵌套模型。泊松模型中基于回归的过度分散测试 探索了针对一般方差函数的一类测试。
但是,我建议首先研究残差图,例如Pearson或偏差残差(或其平方值)相对于拟合值的图。如果方差的函数形式不正确,您将在残差图中将其视为漏斗形状(或残差平方的趋势)。如果功能形式正确,即没有漏斗或趋势,则仍然可能存在过度分散或分散不足的情况,但这可以通过估计分散参数来解决。残差图的好处是,它比检验更清楚地表明方差函数出了什么问题(如果有的话)。
在OP的具体情况下,无法确定0.8是否表示从给定信息中分散不足。我建议不要着重于5和0.8的估计,首先建议研究Poisson模型和负二项式模型的方差函数的拟合。一旦确定了方差函数的最合适的函数形式,就可以在任一模型中包括一个弥散参数(如果需要),以针对任何其他过度弥散或欠弥散调整统计推断。不幸的是,如何在SAS中轻松地做到这一点并不是我可以帮助的。