泊松/对数线性模型的似然比检验是否需要调整零计数?


9

如果列联表中的数字为0,并且我们正在对嵌套的泊松/对数线性模型(使用R glm函数)进行似然比检验,那么在拟合glm模型之前是否需要调整数据(例如,将1/2加到所有计数)?显然,如果不进行一些调整就无法估计某些参数,但是调整/缺少调整对LR测试有何影响?


glm如果例程不能处理零,则该例程可能会跳动。你试过了吗?
shabbychef 2011年

1
是的,它不会崩溃,但是取决于公式(例如,在饱和模型中),某些参数实际上可能具有无限的标准误差。我的问题是在进行似然比检验时这是否是一个问题。即使未估计某些参数,您仍然可以计算似然度,这些参数只会对似然度无贡献。什么是标准做法,为什么?
BR1

Answers:


7

回归建模的力量之一通常是可以平滑无数据的区域-尽管您已经注意到,估计参数有时会出现问题。我建议,如果遇到无限标准错误之类的问题,那就该重新考虑一下建模方法了。

需要特别注意的一点:特定层次中的“无计数”之间存在区别,并且该层次中不可能存在计数。例如,假设您正在研究2000年至2009年之间的美国海军心理疾病,并且对“是女人”和“在潜艇上服役”都有二元回归术语。尽管两个变量都为1,而两个变量都为1时,回归模型也许能够估计两个变量= 1时的影响。但是,这种推断将是无效的-这种情况是不可能的。这个问题称为“非正性”,有时在高度分层的模型中也是一个问题。


@ skyguy94奇怪的是我没有-我知道,我只是忘了注意回顾数据集>。<的使用。编辑以反映这一点。
Fomite

回复:“回归模型可能能够估计两个变量都为1 或两者之间相互作用时的效果 ”-我认为这不是真的。如果您有两个永远不会在一起的二进制预测变量,则交互作用是恒定的(始终为“ 0”),因此无法确定其影响。
2012年

@Macro你是对的,我正在稍微编辑。我在考虑不是二进制指标的术语。
Fomite

1
(+1)因此,当两者都为1时,存在非合理性的问题,基于模型的估计将仅仅是两个边际效应的总和,我们知道这本身就很容易引起误解:)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.