在GLM框架内(8个GLM分布中只有3个用于计数数据),我试图为自己布局适合何时使用哪种回归类型(几何,泊松,负二项式)和计数数据。我已阅读了有关负二项式和泊松分布的文章。
何时将Poisson,几何和负二项式GLM用于计数数据?
到目前为止,我有以下逻辑:它计数数据吗?如果是,均值和方差不相等吗?如果是,则为负二项式回归。如果否,则泊松回归。零通胀吗?如果是,则零泊松或零负二项式。
问题1似乎没有明确指示何时使用。有什么可以告知该决定的信息吗?据我了解,一旦您切换到ZIP,平均方差等于假设就可以放宽了,因此它再次与NB非常相似。
问题2几何族适用于此?在决定是否在回归中使用几何族时,我应该问数据什么样的问题?
问题3我看到人们一直在交换负二项式和泊松分布,而不是几何形状,因此我猜想何时使用它会有明显不同。如果是这样,那是什么?
PS:如果人们想评论/调整它以便进行讨论,我已经制作了一个(根据评论可能过于简化)图表(可编辑)。