我正在为某些数据建模,但是我不确定我可以使用哪种类型的模型。我有计数数据,我想要一个模型,该模型将给出数据均值和方差的参数估计。也就是说,我有各种预测因素,我想确定是否有任何因素会影响方差(而不仅仅是组均值)。
我知道泊松回归将不起作用,因为方差等于均值。这个假设对我而言无效,因此我知道存在过度分散的情况。但是,负二项式模型只会生成一个过分散参数,而不会作为模型中预测变量的函数。什么模型可以做到这一点?
另外,将赞赏对讨论模型的书或论文的参考和/或实现模型的R包。
1
您如何知道没有先进行泊松回归就存在过度分散?毕竟,将原始(响应)值的方差与其平均值进行比较并不重要:重要的是泊松模型的拟合优度(这是评估线性模型中的残差分布与评估响应变量的分布)。另一种表达方式是,即使在精美精确的Poisson模型中,自变量与响应之间的联系也会造成过度分散的现象。
—
Whuber
@whuber这是一个公平的观点。对于单个分类预测器,查看子组的方差和均值就足以检测过度分散,但是对于多元Poisson回归而言,则不是。为了便于讨论,我们假设已经完成了Poisson回归和负二项式回归,并且通过anova模型比较,负二项式显示出更好的拟合度。那应该表明过度分散。鉴于此,如何用参数而不是常数来对方差/过度分散建模?
—
布莱恩·迪格斯
我认为在McCullagh和Nelder的第二版《广义线性模型》中有一章涵盖了这一点(但我的副本正在编写中)...虽然没有真正的可能性,但是您可以使用拟似然性,这样可能是本章的标题。即使没有对应的概率模型,也要迭代地加权最小二乘法。
—
卡尔