泊松回归与对数最小二乘回归?


21

泊松回归是具有对数链接功能的GLM

对非正态分布的计数数据进行建模的另一种方法是通过获取日志(或者将log(1 + count)处理为0)进行预处理。如果对对数计数响应进行最小二乘回归,这与泊松回归有关吗?它可以处理类似的现象吗?


6
您如何计划取任何零的对数?
ub

3
绝对不等同。一种简单的查看方法是查看观察到零计数会发生什么。(创建评论后才看到@whuber的评论。显然此页面未在我的浏览器上正确刷新。)
主教

好吧,我显然应该说log(1 + count)。显然不是等效的,但想知道是否存在某种关系,或者它们是否可以处理类似的现象。
布伦丹·奥康纳

1
这里有一个关于此问题的有用讨论:blog.stata.com/2011/08/22/…–
Michael Bishop

Answers:


22

一方面,在泊松回归中,模型方程式的左侧是期望计数的对数:。日志Ë[ÿ|X]

另一方面,在“标准”线性模型中,左侧是法向响应变量的期望值:。特别地,链接功能是身份功能。Ë[ÿ|X]

现在,让我们说是一个泊松变量,您打算通过对数进行归一化:Y ' = log Y 。因为Y '应该是正常的,所以您计划拟合左侧为E [ Y ' | |的标准线性模型。x ] = E [ log Y | x ]。但是,通常,E [ log Y | x ] log Eÿÿ=日志ÿÿË[ÿ|X]=Ë[日志ÿ|X]。结果,这两种建模方法是不同的。Ë[日志ÿ|X]日志Ë[ÿ|X]


6
其实,曾经除非PŸ = ˚F X | X = 1一段σ X -measurable功能˚F,即ÿX完全确定。Ë日志ÿ|X日志Ëÿ|X Pÿ=FX|X=1个σXFÿX
主教

@cardinal。很好。
suncoolsu 2011年

9

我看到两个重要的区别。

首先,预测值(按原始比例)表现不同;以对数线性最小二乘表示条件几何均值;在对数泊松模型中,代表条件均值。由于此类分析中的数据通常会偏斜,因此条件几何均值会低估条件均值。

第二个区别是隐含分布:对数正态与泊松。这与残差的异方差结构有关:与方差期望值成正比的残差方差(对数正态)与与期望值成正比的残差方差(泊松)。


-1

一个明显的区别是,泊松回归将产生整数作为点预测,而对数计数线性回归会产生非整数。


12
这是如何运作的?GLM不会估计未必是期望的期望吗?
Whuber

1
这是不正确的。从机械上讲,泊松回归能够完美地处理非整数。标准错误不会进行泊松分布,但是您可以使用可靠的标准错误来代替。
马修
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.