Answers:
偏差是GLM概念,ZIP和ZINB模型不是glms,而是公式化为GLM分布的有限混合,因此可以通过EM算法轻松解决。
这些注释简明扼要地描述了偏差理论。如果您阅读这些说明,将会看到证明泊松回归的饱和模型具有对数似然的证明
这是由插件估算。
现在,我将继续介绍ZIP可能性,因为数学更简单,ZINB的结果相似。不幸的是,对于ZIP来说,没有像Poisson这样简单的关系。第个观测对数似然是
该没有观察到如此解决这个你需要采取偏导数WRT都和,设置方程为0,然后求解和。这里的困难是值,这些值可以放入或并且如果没有观察就不可能将观测值放入其中。但是,如果我们知道值,则不需要ZIP模型,因为我们不会丢失任何数据。观察到的数据对应于EM形式主义中的“完整数据”可能性。
一种可能合理的方法是使用完整数据对数似然的期望wrt来删除并替换为期望,这是EM算法使用最新更新计算的部分内容(E步)。我没有发现任何文献研究这种方法以达到偏差。
另外,首先问了这个问题,所以我回答了这个帖子。但是,在同一主题上还有另一个问题,这里有Gordon Smyth的一个很好的评论: 零膨胀复合泊松模型的偏差,连续数据(R) ,他提到了相同的回答(这是我想对这个评论的详尽阐述(例如)),以及他们在另一篇文章的评论中提到的您可能想要阅读的论文。(免责声明,我尚未阅读所引用的论文)