零膨胀泊松或零膨胀负二项式的“偏差”度量?


11

比例偏差定义为D = 2 *(饱和模型的对数似然度减去拟合模型的对数似然度),通常用作GLM模型中拟合优度的度量。解释的偏差百分比定义为[D(零模型)-D(拟合模型)] / D(零模型),有时也用作线性回归的R平方的GLM模拟。除了ZIP和ZINB分布不属于指数分布的事实外,我很难理解为什么零膨胀建模中未使用比例偏差和百分比偏差。谁能对此有所启发或提供有用的参考?提前致谢!


一个非常好的问题-我也想知道这一点
user2673238

Answers:


3

偏差是GLM概念,ZIP和ZINB模型不是glms,而是公式化为GLM分布的有限混合,因此可以通过EM算法轻松解决。

这些注释简明扼要地描述了偏差理论。如果您阅读这些说明,将会看到证明泊松回归的饱和模型具有对数似然的证明

(λs)=i=1,yi0n[yilog(yi)yilog(yi!)]

这是由插件估算。yi=λ^i

现在,我将继续介绍ZIP可能性,因为数学更简单,ZINB的结果相似。不幸的是,对于ZIP来说,没有像Poisson这样简单的关系。第个观测对数似然是i

i(ϕ,λ)=Zilog(ϕ+(1ϕ)eλ)+(1Zi)[λ+yilog(λ)log(yi!)].

该没有观察到如此解决这个你需要采取偏导数WRT都和,设置方程为0,然后求解和。这里的困难是值,这些值可以放入或并且如果没有观察就不可能将观测值放入其中。但是,如果我们知道值,则不需要ZIP模型,因为我们不会丢失任何数据。观察到的数据对应于EM形式主义中的“完整数据”可能性。Ziλϕλϕyi=0λ^ϕ^Ziyi=0Zi

一种可能合理的方法是使用完整数据对数似然的期望wrt来删除并替换为期望,这是EM算法使用最新更新计算的部分内容(E步)。我没有发现任何文献研究这种方法以达到偏差。ZiE(i(ϕ,λ))Ziexpected

另外,首先问了这个问题,所以我回答了这个帖子。但是,在同一主题上还有另一个问题,这里有Gordon Smyth的一个很好的评论: 零膨胀复合泊松模型的偏差,连续数据(R) ,他提到了相同的回答(这是我想对这个评论的详尽阐述(例如)),以及他们在另一篇文章的评论中提到的您可能想要阅读的论文。(免责声明,我尚未阅读所引用的论文)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.