当有人说泊松模型的残余偏差/ df应该约为1时,近似值是多少?


16

我经常看到有关检查Poisson模型拟合是否过度分散的建议,其中包括将剩余偏差除以自由度。所得比率应为“大约1”。

问题是,我们所说的“近似”范围是多少?应该发出警报以考虑替代模型形式的比率是多少?


2
不能回答这个有趣的问题,但是我经常要做的是运行几个模型(例如Poissson,NB,可能是零充气版本)并在AIC类型的度量和预测值上进行比较。
彼得·弗洛姆

该链接可能是您感兴趣的。特别是“适合度评估标准”部分。

@Procrastinator链接是我所讨论内容的完美示例:“然后,如果我们的模型很好地拟合了数据,则偏差与DF的比率(Value / DF)应约为1。较大的比率值可能表示模型规格不正确或响应变量过度分散;比率小于1也可能表示模型规格不正确或响应变量未充分分散。” “约1”的范围是多少?0.99至1.01?0.75到2?
Fomite 2012年

r-bloggers.com/…也提供了有关如何回答此问题的一些信息,尽管@StasK的回复对此进行了很好的介绍。
2016年

Answers:


14

10大... 1.01不是。由于方差χk22k(见维基百科),的标准偏差χk2就是2k,那的χk2/kIS2/k。那是你的标尺:对于χ1002,1.01并不大,但2大(7个SDS的距离)。对于χ10,0002,1.01是OK,但是1.1不是(7个SDS距离)。


1
“这样具有的标准偏差χk2/k “您能否将我定向到演示此内容的地方?2/k
baxx

amazon.com/…。抱歉,我是混蛋,但这是统计推断的参考分布;如果您不理解它,则不应使用泊松(Poisson)等广义线性模型。
StasK

2
为了将来的参考,您可以声明信息和参考,而不必跟前缀/道歉有关的混蛋。这可能会节省您的键入时间,并使您看起来不再是个混蛋,这可能是一种新颖的体验。
baxx

请参阅编辑和Wikipedia参考。几年来,我已经自愿提供了数百个答案,所以我承认要拥有真正新颖的经历有点困难。
StasK

7

渐近线的偏差应为卡方分布,且均值等于自由度。因此,将其除以其自由度,如果数据没有过度分散,则应该得到大约1。要获得适当的测试,只需查找卡方表中的偏差-但请注意(a)卡方分布是一个近似值,以及(b)高值可以表明其他类型的不匹配(这也许就是为什么“大约1”被认为足以胜任政府工作)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.