使用泊松回归获取连续数据?


11

泊松分布可以用于分析连续数据以及离散数据吗?

我有一些数据集,其中的响应变量是连续的,但类似于泊松分布而不是正态分布。但是,泊松分布是离散分布,通常与数字或计数有关。


那么,您的经验分布与Gamma变量有何不同?
ub

1
我已经使用了这些数据的伽马分布。如果将gamma分布与对数链接一起使用,则可以获得与过度分散的Poisson模型几乎完全相同的结果。但是,在大多数统计软件包中,我熟悉的Poisson回归更简单,更灵活。
user3136 2011年

会不会有其他更好的分布,例如whuber建议使用伽玛?
彼得·弗洛姆

1
@PeterFlom-我想知道这个问题是否会出现很多,因为R中的glmnet软件包不支持带有日志链接功能的Gamma系列或Gaussian系列。但是,由于glmnet用作预测建模包(因此用户仅对模型系数感兴趣,而对系数误差不感兴趣),并且由于Poisson dbn会产生一致的系数。无论分布如何,对于具有连续响应的ln [E(y)] = beta0 + beta * X形式的模型的估计,我猜测glmnet的作者并没有考虑这些额外的族。
RobertF 2015年

Answers:


12

在给定预测变量值的情况下,与此处相关的广义线性模型的关键假设是方差与响应平均值之间的关系。当您指定泊松分布时,这意味着您假设条件方差等于条件均值。* 分布的实际形状并不重要:它可以是泊松,伽玛或正态,或其他任何条件,只要均值-方差关系成立即可。

*您可以放宽方差等于均值等于比例之一的假设,并且通常仍可获得良好的结果。


9

如果您正在谈论在广义线性模型中使用泊松响应,那么可以,如果您愿意假设每个观测值的方差等于其均值。

如果您不想这样做,另一种选择可能是转换响应(例如获取日志)。


我认为,除了您的观点之外,即使@ user3136不愿意假设均值=方差,他/她也可以使用中的quasipoisson家庭glm
suncoolsu

2
但是我的问题是,为什么要将连续数据转换为离散数据。实质上是在丢失信息。同样,当进行简单log转换时,为什么要离散化数据?使用glm作品,但每个结果都是基于渐近论的(可能成立或未成立)
suncoolsu 2011年

@suncoolsu:1)拟泊松假设均值与方差成正比。2)我不是指变换为离散,而是指变换(保持连续性),因此您可以使用其他模型。
西蒙·拜恩

是的-我了解您的同意。抱歉,我在说这个问题。准泊松,考虑到过度分散对吧?(如果我没记错的话,请参见Faraway 2006)
suncoolsu 2011年

在这种特殊情况下,我不满意我尝试的任何变换(log,sqrt,box-cox)都能很好地近似正态性。顺便说一句,如果我使用普通分数转换方法,则可以将大多数数据转换为几乎完美的常态,但是我没有看到这种转换被广泛使用,因此我认为存在一个难点(很难进行反向转换)。
user3136 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.