何时在Poisson回归中使用可靠的标准误差?


10

我将Poisson回归模型用于计数数据,并且想知道是否有理由不对参数估计使用健壮的标准误差?我特别担心,因为我的一些估计值没有显着性(例如,p = 0.13)不显着(例如,p = 0.13),但是具有显着性(p <0.01)。

在SAS中,可以通过使用proc genmod(例如repeated subject=patid;)中的重复语句来实现。我一直以http://www.ats.ucla.edu/stat/sas/dae/poissonreg.htm为例,引用了Cameron和Trivedi(2009)的一篇论文,以支持使用可靠的标准错误。

Answers:


6

通常,如果您怀疑自己的错误是异方差的,则应该使用可靠的标准错误。当您不使用健壮的SE时,您的估计变得不重要的事实表明(但没有证明)需要健壮的SE!这些SE对异方差可在广义线性模型中引起的偏见“具有鲁棒性”。

但是,这种情况有些不同,因为您将它们放在Poisson回归之上。

泊松具有众所周知的属性,即无论数据是否支持均值,均会迫使色散等于均值。在考虑健壮的标准误差之前,我将尝试负二项式回归,该回归不会受到此问题的困扰。有一项测试(请参见注释)可以帮助确定标准误差的结果变化是否重大。

我不确定您所看到的变化(移动到强大的SE会否缩小CI)是否意味着分散不足,但这似乎是可能的。看一看合适的模型(我认为是负二项式,但是快速搜索也可以暗示拟Poisson的色散不足),看看在这种情况下会得到什么。


好答案!通常,在OLS中,异方差不会导致参数无偏(仅效率不高)。尽管对于广义线性模型,这不是正确的,请参阅Dave Giles的有关此帖子的参考。我不认为我曾见过为此建议使用Vuong测试(对于非嵌套零膨胀模型的比较,我已经看到了建议)。泊松嵌套在Neg中。二项式模型,因此可以对色散参数使用似然比检验。
Andy W

感谢您的回答。我确实尝试过负二项式回归,但遇到警告:“相对黑森州收敛准则0.0046138565大于极限0.0001。该收敛性值得怀疑。” 请注意,我的响应变量是一个数值,范围从0到4。是否对因变量或自变量进行了转换以帮助收敛?或在这种情况下该怎么办?
2012年

另外,与非鲁棒的SE较小有关-在我的分析中,我看到了健壮的SE较小,这才是意义所在(而不是非鲁棒的结果)。这就是为什么我要小心是否报告可靠的结果的原因-我不想仅因为具有重要的pvalue而选择此方法!再次感谢!
2012年

@AndyW我检查了笔记,Vuong确实是ZI对Poisson的。更新的帖子。卡拉我错过了逆转。您可能分散的数据,在这种情况下,NBD可能也是解决方案:-)
Ari B. Friedman 2012年

@kara很难在评论中诊断您的非收敛性问题。我会尝试提供一个尽可能多的信息来解决这个问题。
阿里·弗里德曼

1

我将基于模型的标准错误与健壮的标准错误称为“ GEE”(实际上是可互换的定义),以区分分析。除了Scortchi出色的解释之外:

GEE可以在小样本(即10至50个受试者)中“偏向”:(Lipsitz,Laird和Harrington,1990年; Emrich和Piedmonte,1992年; Sharples和Breslow,1992年; Lipsitz等人,1994年; Qu,Piedmonte和Williams,1994年; Gunsolley,Getchell和Chinchilli,1995年; Sherman和le Cessie,1997年。)当我说GEE偏差时,我的意思是,由于细胞计数少或为零,标准误差估计可以是保守的也可以是保守的。 ,取决于哪些拟合值表现出此行为以及它们与回归模型的整体趋势的一致性。

通常,正确指定参数模型后,您仍然可以从基于模型的CI中获得正确的标准误差估计值,但是使用GEE的全部目的是要适应很大的“ if”。GEE允许统计人员仅指定数据的工作概率模型,并且参数(而不是在严格的参数框架中进行解释)被认为是一种“筛子”,可以生成可重复的值,而与潜在的未知数据生成无关机制。这是半参数分析的核心,而GEE就是其中的一个例子。

即使指定了独立的相关矩阵,GEE也会处理数据中未测的协方差源。这是因为使用了经验而不是基于模型的协方差矩阵。例如,在泊松建模中,您可能会对从各种溪流中采样的鲑鱼的繁殖率感兴趣。从雌性鱼类中收获的卵可能具有潜在的泊松分布,但是遗传变异包括共同的可遗传性和特定流中的可用资源,可能使这些流中的鱼比其他流中的鱼更相似。只要采样率与其人口比例一致(或以其他方式分层),GEE就会给出正确的人口标准误差估计。


1

您对等散零进行测试。这是一个简单的辅助OLS回归。Cameron和Trivedi的第670页有说明。由于存在较大的过度分散,因此标准误差会大大缩小,因此,对于过度分散时依赖于非稳健VCE的任何结果,我都会非常警惕。对于分散不足,情况恰恰相反,这听起来像您所处的场景。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.