R中的零膨胀计数模型:真正的优势是什么?


11

为了分析零膨胀的鸟类计数,我想使用R包pscl应用零膨胀的计数模型。但是,查看文档中提供的主要功能之一(?zeroinfl)的示例后,我开始怀疑这些模型的真正优势是什么。根据此处给出的示例代码,我计算了标准泊松,拟泊松和负生物模型,简单的零膨胀泊松和负二项式模型以及零膨胀泊松模型和负二项式模型,其中零分量为回归变量。然后,我检查了观测数据和拟合数据的直方图。(这是复制该代码的代码。)

library(pscl)
data("bioChemists", package = "pscl")

## standard count data models
fm_pois  <- glm(art ~ .,    data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ .,    data = bioChemists, family = quasipoisson)
fm_nb    <- glm.nb(art ~ ., data = bioChemists)

## with simple inflation (no regressors for zero component)
fm_zip  <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")

## inflation with regressors
fm_zip2  <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd + 
                     ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd + 
                     ment, data = bioChemists, dist = "negbin")

## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art,  breaks=breaks)
hist(fitted(fm_pois),  breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb),    breaks=breaks)
hist(fitted(fm_zip),   breaks=breaks)
hist(fitted(fm_zinb),  breaks=breaks)
hist(fitted(fm_zip2),  breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!

观察和拟合数据的直方图

我看不到不同模型之间的任何根本区别(除了示例数据对我而言似乎不是“零膨胀” ...);实际上,没有一个模型可以对零的数目进行一半合理的估计。谁能解释零膨胀模型的优点是什么?我想肯定有理由选择这个作为函数的示例。

Answers:


15

我认为这是一个很少选择的数据集,无法用来探索零膨胀模型的优势,因为正如您所注意到的,零膨胀率并没有那么多。

plot(fitted(fm_pois), fitted(fm_zinb))

显示预测值几乎相同。

在零通货膨胀更大的数据集中,ZI模型给出的结果与Poisson不同(并且通常拟合效果更好)。

比较模型拟合度的另一种方法是比较残差的大小:

boxplot(abs(resid(fm_pois) - resid(fm_zinb)))

表明即使在这里,泊松的残差也小于津巴布韦的残差。如果您对残差的大小确实有问题的想法,可以看到每个模型中残差的比例是多少。例如,偏离超过1是不可接受的

sum(abs(resid(fm_pois) > 1))
sum(abs(resid(fm_zinb) > 1))

表明后者要好一些-大残差减少20个。

然后的问题是,增加模型的复杂性是否值得您这样做。


6

由于随机变化,拟合值将显示出比观察值小的分散。您没有进行有意义的比较。举一个简单的例子,如果您的数据只是,则不会将的直方图与拟合值的直方图进行比较-所有数据均相同!尽管从模拟值并比较和直方图是合理的。X μX * X * P ø 小号μX * X XiPois(μ)xiμ^ixiXiPois(μ^)xixi


您会推荐其他哪种比较?
user7417

有关模型之间的良好比较,请参见Peter的答案。
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.