泊松回归假设以及如何在R中对其进行检验


11

我想测试哪种回归最适合我的数据。我的因变量是一个计数,并且有很多零。

而且,我需要一些帮助来确定使用哪种模型和家庭(泊松或准泊松,或零膨胀泊松回归),以及如何检验这些假设。

  1. 泊松回归:据我了解,一个强有力的假设是因变量均值=方差。您如何测试呢?他们必须有多近?是否为此使用了无条件或有条件的均值和方差?如果这个假设不成立怎么办?
  2. 我读到,如果方差大于均值,则说明我们存在过度分散,解决这一问题的潜在方法是包括更多自变量,或称family = quasipoisson。此分布是否还有其他要求或假设?我该使用哪种测试来查看(1)或(2)是否更合适-简单anova(m1,m2)
  3. 我还读到,当出现过度分散时,可以使用负二项分布。如何在R中执行此操作?与拟泊松有什么区别?
  4. 零膨胀泊松回归:我读到使用vuong检验可以检查哪种模型更合适。

    > vuong (model.poisson, model.zero.poisson)

    那是对的吗?零膨胀回归有什么假设?

  5. 加州大学洛杉矶分校的学术技术服务,统计咨询集团拥有部分约zeroinflated泊松回归,并测试与标准泊松模型(二)zeroinflated模型(一):

    > m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
    > m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
    > vuong(m.a, m.b)

我不了解| persons第一个模型的功能,以及为什么可以比较这些模型。我曾期望回归是相同的,只是使用不同的家庭。

Answers:


8

1)计算平均值和样本方差。应该是分布,其中是样本的大小,并且过程是真正的泊松-因为它们是独立的估计具有相同的方差。 F1n1nX¯S2F(1,n1)n

请注意,该测试忽略了协变量-因此可能不是检查这种情况下过度分散的最佳方法。

还要注意,该测试可能在零膨胀假设方面较弱。

3)中的R负二项:使用glm.nbMASS包,或者使用zeroinfl从所述函数pscl使用所述负二项式链路包。

4)zip(零膨胀泊松)是一种混合模型。您有一个二元结果,根据该结果,受试者属于A组(确定为0)或B组(计数为泊松或负二项式分布)。观察到的0是由于A组的受试者+ B组的受试者刚好很幸运。模型的两个方面都可以取决于协变量:组成员关系的建模类似于对数模型(协变量的对数几率是线性的),泊松部分的建模通常采用以下方法:协变量中的对数均值是线性的。因此,您需要逻辑学的通常假设(对于0的某个部分)和泊松的通常假设。换句话说,zip模型无法解决您的过度分散问题-只能解决零的问题。

5)不确定数据集是什么并且找不到参考。zeroinfl既需要泊松部分又需要二进制(部分为0)的模型。特定的0部分排在第二位。因此,马说的是,该人是否为某个0取决于“人”,并且假设对象不是某个0,则计数是露营者和孩子的函数。换句话说,log(mean)是那些不需要0计数的受试者的露营者和孩子的线性函数。

mb只是一个关于露营者和孩子的线性计数的通用线性模型-都假定为固定效应。链接函数是泊松。


谢谢!一个简单的问题:是否有一种方法可以使用R中的family = poisson在glm中生成类似于Nagelkerke的r ^ 2或伪r ^ 2?谢谢!
Torvon 2012年

0
  1. 图书馆(pastecs)

stat.desc(dep_var)-然后查看均值和方差是否相等。从这里,您还可以计算向量中零的百分比。


3
欢迎来到该网站。这更像是评论而不是答案。同样,最好使用适当的拼写等等,这不是发短信,而且阅读此站点的许多人都将英语作为第二,第三或..语言。
彼得·弗洛姆

3
请改进此快速回复。
chl 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.