计数数据方差的参数化建模


12

我正在为某些数据建模,但是我不确定我可以使用哪种类型的模型。我有计数数据,我想要一个模型,该模型将给出数据均值和方差的参数估计。也就是说,我有各种预测因素,我想确定是否有任何因素会影响方差(而不仅仅是组均值)。

我知道泊松回归将不起作用,因为方差等于均值。这个假设对我而言无效,因此我知道存在过度分散的情况。但是,负二项式模型只会生成一个过分散参数,而不会作为模型中预测变量的函数。什么模型可以做到这一点?

另外,将赞赏对讨论模型的书或论文的参考和/或实现模型的R包。


1
您如何知道没有先进行泊松回归就存在过度分散?毕竟,将原始(响应)值的方差与其平均值进行比较并不重要:重要的是泊松模型的拟合优度(这是评估线性模型中的残差分布与评估响应变量的分布)。另一种表达方式是,即使在精美精确的Poisson模型中,自变量与响应之间的联系也会造成过度分散的现象。
Whuber

2
@whuber这是一个公平的观点。对于单个分类预测器,查看子组的方差和均值就足以检测过度分散,但是对于多元Poisson回归而言,则不是。为了便于讨论,我们假设已经完成了Poisson回归和负二项式回归,并且通过anova模型比较,负二项式显示出更好的拟合度。那应该表明过度分散。鉴于此,如何用参数而不是常数来对方差/过度分散建模?
布莱恩·迪格斯

1
我认为在McCullagh和Nelder的第二版《广义线性模型》中有一章涵盖了这一点(但我的副本正在编写中)...虽然没有真正的可能性,但是您可以使用拟似然性,这样可能是本章的标题。即使没有对应的概率模型,也要迭代地加权最小二乘法。
卡尔

McCullagh和Nelder的第10章讨论了均值和色散的联合建模,即参数化均值和方差。扩展的拟似然性是主要工具,但在某些情况下,该方法
guest

Answers:


9

您可以使用R中的gamlss软件包将负二项式离散参数本身建模为变量和参数的函数。我提供了摘录:

为什么要使用GAMLSS

如果您的响应变量是计数(离散)数据,则Poisson分布很可能不合适。GAMLSS提供了您可以尝试的各种离散分布(包括负二项式)。弥散参数也可以根据解释变量进行建模。

www.gamlss.org网站提供了文档,并提供了有关该软件包中使用的方法的几篇论文的链接。


两种答复都是有用的,并提供了很好的参考。我授予这笔赏金,是因为(a)它先于另一花了四分钟,并且(b)gamlss解决方案对我来说是新的(我对nbreg熟悉)。但是对@timbp表示感谢,因为他们提供了很好的答复。希望您继续为我们的网站做出贡献。
whuber

2
@whuber,我也很困惑接受哪个答案作为“答案”,因为两者都很有帮助。我选择了这个,因为它包含了我可以使用的R包参考。另一个答案中的书参考书读起来不错,不应打折。感谢您提供的赏金促使这两个很好的答案。
Brian Diggs

9

Stata提供了-gnbreg-命令,该命令使您可以对色散参数进行建模。您可以在http://www.stata.com/help.cgi?nbreg上查看该命令的Stata帮助

Stata将此称为广义负二项式模型。约瑟夫·希尔伯(Joseph Hilbe)在其“负二项式回归”一书的第10.4节中将其讨论为“ NB-H:异质性二项式回归”。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.