广义线性模型的假设


9

在“应用回归的R伴侣”的第232页上,Fox和Weisberg注意

只有高斯族具有恒定的方差,在所有其他GLM中,处y的条件方差取决于XμX

先前,他们注意到泊松的条件方差是,而二项式的条件方差是。μμ1个-μñ

对于高斯人来说,这是一个熟悉且经常检查的假设(均方差)。同样,我经常看到讨论的Poisson条件方差是Poisson回归的假设,以及对违反Poisson的情况(例如负二项式,零膨胀等)的补救措施。但是,我从未将讨论的二项式的条件方差视为逻辑回归中的假设。有点谷歌搜索没有发现它。

我在这里想念什么?

在@whuber的评论之后进行编辑:

根据建议,我正在浏览Hosmer&Lemeshow。这很有趣,我认为这表明了为什么我(可能还有其他人)感到困惑。例如,单词“假设”不在书的索引中。另外,我们有这个(第175页)

在逻辑回归中,我们必须主要依靠视觉评估,因为仅在某些有限的条件下才知道模型适合的假设下的诊断分布

他们显示了很多图,但专注于各种残差的散点图与估计的概率。这些图(即使是一个好的模型,在OLS回归中也没有类似图的“破旧”模式特征,因此很难判断。此外,它们与分位数图没有任何相似之处。

在R中,plot.lm提供了一套漂亮的默认绘图来评估模型;我不知道逻辑回归的等效项,尽管它可能在某些软件包中。这可能是因为每种类型的模型都需要不同的图。SAS确实在PROC LOGISTIC中提供了一些地块。

当然,这似乎是一个潜在的混乱领域!


3
如果您有Hosmer&Lemeshow的《应用逻辑回归》的副本请查看“评估模型的拟合度”一章:二项式的条件方差随处可见,并且几乎在所有GoF检验中均已明确说明。
Whuber

1
我认为二项式假设是由真实实验强加的:响应是独立的0/1,因此二项式分布是唯一模拟真实实验的模型。相反,对泊松分布进行计数的假设是不现实的。
斯蒂芬·洛朗

1
谢谢@whuber。我有那本书,将要检查出来
彼得·弗洛姆

...但链接的功能是不自然的,它决定了条件方差...所以我的上述评论是不是非常明智的
斯特凡洛朗

Answers:


3

这些图(即使是一个好的模型,在OLS回归中也没有类似图的“破旧”模式特征,因此很难判断。此外,它们与分位数图没有任何相似之处。

达摩ř包解决了这个问题通过从拟合模型模拟到任何GL(M)M的残差变换成标准化的空间。完成此操作后,可以应用所有常规方法从视觉上和形式上评估残留问题(例如qq图,过度分散,异方差,自相关)。请参阅包装插图,以获取通过的示例。

关于@Otto_K的评论:如果唯一的问题是同质过散,则使用观察级随机效应可能更简单,该效应可以通过标准二项式GLMM来实现。但是,我认为@PeterFlom还担心异方差性,即色散参数随某些预测变量或模型预测的变化。标准的超分散检查/校正不会对此进行校正/校正,但您可以在DHARMa残差图中看到它。为了进行校正,在JAGS或STAN中将色散建模为其他函数的功能可能是目前的唯一方法。


1

您解释的主题通常称为过度分散。在我的工作中,我看到了针对该主题的可能解决方案:

使用贝叶斯方法,并估计Beta-二项分布。对于具有封闭形式的解决方案的其他分布(由其他先验条件引起),这具有很大的优势。

参考文献:

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.