零截断的Poisson和基本Poisson是嵌套的还是非嵌套的?


9

我已经看到了很多讨论基本Poisson回归是否为零膨胀Poisson回归的嵌套版本的文章。例如,此站点认为是这样,因为后者包括用于建模其他零的额外参数,但其他方面包括与前者相同的泊松回归参数,尽管该页面确实包含了不同意的引用。

我找不到的信息是是否嵌套了零截断的Poisson和基本的Poisson。如果零截断的Poisson只是具有额外规定零计数的概率为零的Poisson,那么我想听起来像是可能的,但我希望有一个更明确的答案。

我想知道的原因是,这会影响我是否应该使用Vuong检验(对于非嵌套模型),还是基于对数似然差的更基本的卡方检验(对于嵌套模型)。

威尔逊(2015)讨论了Vuong检验是否适合将零膨胀回归与基本检验进行比较,但我找不到讨论零截断数据的资料。

Answers:


4

现在就遇到这个。为避免混淆,我是原始问题中引用的Wilson(2015)的Wilson,该问题询问Poisson模型和截短的Poisson模型是嵌套的,非嵌套的等。稍微简化一下,如果较大的模型嵌套在较大的模型中,如果模型的参数子集固定为指定值,则模型缩小为较小的模型;如果两个模型在各自参数的子集固定为特定值时都归结为同一模型,则它们是重叠的,如果参数如何固定,一个模型都不能归结为另一个模型,则这两个模型是非嵌套的。根据此定义,截短的Poisson和标准Poisson是非嵌套的。但是,这一点似乎已经为许多人所忽略,Vuong的分布理论指的是严格嵌套,严格非嵌套,并严格重叠。“严格”是指在嵌套等的基本定义上增加六个限制。这些限制并非完全简单,但是除其他外,它们确实意味着Vuong关于对数似然比分布的结果不适用于以下情况:模型/分布嵌套在参数空间的边界处(例如泊松/零膨胀泊松,零膨胀参数具有标识链接的情况),或者当一个参数趋于无穷大时一个模型趋向另一个时,例如当使用logit链接对零膨胀参数建模时,泊松/零膨胀泊松就是这种情况。在这种情况下,Vuong没有提出关于对数似然比分布的理论。不幸的是,

下面的R代码将模拟泊松和截断的泊松对数似然比的分布。它需要VGAM包装。

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")

4

基本的泊松可以认为是嵌套在更一般的形式中的:

p(x)=(1p)eλλxx!+p1(x=0)

当,我们有基本的泊松。当,我们得到了零截断的Poisson。当,我们有一个减零的泊松。当,我们有一个零膨胀的泊松,并且我们在处具有简并的分布。p=0 - EXP { - λ } /1 - EXP { - λ } < p < 0 0 < p < 1个p = 1p=exp{λ}/(1exp{λ})exp{λ}/(1exp{λ})<p<00<p<1p=1

因此,在我看来,Vuong测试的嵌套版本或您建议的卡方适用于您的情况。但是请注意,由于“大”(相对于)观测值的小概率,卡方可能会出现问题。除非您有大量数据,否则您可能希望使用引导程序来获取卡方统计量的p值,而不是依赖渐近线。λ


谢谢@jbowman-这是我所希望的更严格的答案。不过,我还不清楚:我认为Vuong测试的重点是针对非嵌套模型,因此即使它超出了我的原始文章,您能否提供更多有关“ Vuong测试的嵌套版本”的信息。要弄清楚我的困惑的根源:直到现在,我只知道R vuong中的软件包pscl中的函数,该函数说这是针对非嵌套模型的。我只是谷歌搜索并找到包含参数“嵌套”的vuongtestnonnest2中的函数。是吗
贾斯汀

对,是。实际上,有关Vuong测试的Wikipedia页面en.wikipedia.org/wiki/Vuong%27s_closeness_test对描述两者之间的差异会有所帮助(通常不是很多)。
jbowman

1
NB 两者的泊松零截断泊松你已经定义了分布的特殊情况。一个不嵌套在另一个中。因此,您不能使用Wilks定理来获得对数似然比的两倍的渐近卡方分布,无论您认为哪个假设都是原假设。(我认为Vuong测试也有一些规律性条件。)
Scortchi-恢复Monica

3
@Scortchi我很好奇您正在应用的“嵌套”的定义。尽管我不同意您的结论,但我从一个稍微不同的角度得出了结论:是的,泊松嵌套在这个族中(因为它是通过限制为),但是关于MLE的渐近分布的各种结论参数估计值不适用,因为这个值位于的边界上。我是否缺少一些重要的区别?p pp=0pp
whuber

2
@whuber,我要评论/提供关于同一点的答案。该引用链接确实指出:“......虽然卡方分布可能需要一些调整,因为限制是参数空间的边界上”
本Bolker
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.