分散数据计数的合适模型是什么?


24

我正在尝试对R中的计数数据进行建模,R的数据显然分散不足(分散参数〜.40)。这可能就是为什么glm具有family = poisson二项式(glm.nb)模型或负二项式()模型不重要的原因。当我查看数据的描述时,我没有计数数据的典型偏斜,并且在我的两个实验条件下的残差也是均匀的。

所以我的问题是:

  1. 如果我的计数数据确实不像计数数据那样运行,我是否还需要对计数数据使用特殊的回归分析?有时我会遇到非正态性(通常是由于峰度),但是我使用百分位数自举法比较修整后的均值(Wilcox,2012年)以解决非正态性问题。可以用Wilcox建议并在WRS软件包中实现的任何可靠方法代替计数数据的方法吗?

  2. 如果必须对计数数据使用回归分析,如何计算色散不足?泊松分布和负二项式分布具有较高的色散,所以这不合适吗?我当时正在考虑应用拟泊松分布,但是通常建议将其用于过度分散。我阅读了有关R包中似乎能够解释过度散布和欠散的beta二项式模型VGAM的信息。但是,作者似乎建议使用倾斜的Poisson分布,但我在包中找不到它。

谁能推荐用于散布数据的过程,并可能提供一些示例R代码?


1
您怎么知道您的数据分散程度不高?您如何计算色散参数?
Hong Ooi 2013年

1
这也有助于告诉我们您感兴趣的更多信息。对于线性预测点估计和值预测,色散很少是一个问题,但是测试和间隔可能不必要地保守(准族可以对此提供帮助)。也就是说,对于“正常”可能性方法,请检查COM Poisson和其他广义Poisson模型。
Momo

@ Hung Ooi:我用分散测试(Poissonmodel,a = c(“较少”))测试了色散,结果证明该测试很有意义。
2013年

1
@ Momo:我想测试两个实验条件下的谈判双子在提供的正确报价上是否不同。正确的报价意味着,二元组会提出更多与团队各自利益相关的问题,而不是为另一方提出更多有价值的问题。首先,我什至不知道这是计数数据。您是指COM Poisson的Conway-Maxwell-Poisson分布吗?非常感谢!
2013年

3
感谢您提供其他信息。是的,我的意思是康韦-麦克斯韦泊松。Shmueli&co为此开发了一个kindbof广义线性模型,如果您想尝试也可以使用R包。
Momo 2013年

Answers:


9

处理欠分散的Poisson数据的最佳方法和标准方法是使用广义Poisson或障碍模型。三个参数计数模型也可用于分散数据。例如Faddy-Smith,Waring,Famoye,Conway-Maxwell和其他广义计数模型。这些的唯一缺点是可解释性。但是对于一般的分散数据,应该使用广义泊松。对于过度分散的数据,它就像负二项式。我在剑桥大学出版社的两本书《 Modeling Count Data》(2014年)和《 Negative Binomial Regression,第二版》(2011年)中对此进行了详细讨论。在R中,VGAM软件包允许广义泊松(GP)回归。色散参数的负值表示对色散不足的调整。您也可以将GP模型用于分散数据,但通常情况下,NB模型更好。归根结底,最好确定色散不足的原因,然后选择最合适的模型来解决它。


欢迎回来!请注册和/或合并您的帐户(您可以在我们的帮助中心的“ 我的帐户”部分中找到有关如何执行此操作的信息),然后就可以对自己的问题进行编辑和评论。(您的原始帐户在这里。)
gung-恢复莫妮卡

您可以在SPSS上执行广义泊松分析吗?
格蕾丝·卡罗尔

3

我曾经遇到过分散的泊松现象,这与人们玩社交游戏的频率有关。事实证明,这是由于人们周五经常玩游戏的规律性。删除星期五的数据给了我预期的过度分散的泊松。也许您可以选择类似地编辑数据。


1

在某些情况下,分散性不足和零通货膨胀结合在一起,这对于男女两性都比较偏爱的孩子来说是很典型的。到目前为止,我还没有找到捕获它的方法

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.