我正在尝试对R中的计数数据进行建模,R的数据显然分散不足(分散参数〜.40)。这可能就是为什么glm
具有family = poisson
二项式(glm.nb
)模型或负二项式()模型不重要的原因。当我查看数据的描述时,我没有计数数据的典型偏斜,并且在我的两个实验条件下的残差也是均匀的。
所以我的问题是:
如果我的计数数据确实不像计数数据那样运行,我是否还需要对计数数据使用特殊的回归分析?有时我会遇到非正态性(通常是由于峰度),但是我使用百分位数自举法比较修整后的均值(Wilcox,2012年)以解决非正态性问题。可以用Wilcox建议并在WRS软件包中实现的任何可靠方法代替计数数据的方法吗?
如果必须对计数数据使用回归分析,如何计算色散不足?泊松分布和负二项式分布具有较高的色散,所以这不合适吗?我当时正在考虑应用拟泊松分布,但是通常建议将其用于过度分散。我阅读了有关R包中似乎能够解释过度散布和欠散的beta二项式模型
VGAM
的信息。但是,作者似乎建议使用倾斜的Poisson分布,但我在包中找不到它。
谁能推荐用于散布数据的过程,并可能提供一些示例R代码?