如何解释泊松GLM结果中的参数估计值[关闭]


14
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

我想知道如何解释上表中的每个参数估计值。



6
这个问题似乎离题,因为它是在解释R输出而没有任何形式的智能问题的情况。这是“我将计算机输出转储到那里,然后您为我运行统计信息分析”的类别...
西安

1
您的分散参数似乎表明您的模型存在一些问题。也许您应该考虑使用拟泊松分布。我敢打赌,您的参数估计值将发生巨大变化,解释也将发生变化。如果运行“ plot(model)”,您将获得一些残差图,在开始解释实际模型之前,请查看这些图上是否存在不需要的模式。为了快速绘制模型的拟合度,您还可以使用visreg软件包中的“ visreg(modelfit)”
Robbie

3
@西安,尽管问题很稀疏且需要编辑,但我认为这不是题外话。考虑不考虑题外话这些问题:的r LM的解释()输出,及的r输出二项式回归的解读。但是,它确实是重复的
gung-恢复莫妮卡

2
这是“ 如何解释泊松回归中的系数?”的副本请阅读链接的线程。如果您在阅读完之后仍然有疑问,请返回此处并编辑您的问题以说明您学到了什么,以及仍然需要知道什么,那么我们可以提供您需要的信息,而无需在其他无济于事的地方重复材料您。
gung-恢复莫妮卡

Answers:


28

我认为您问题的标题不能准确地反映您的要求。

由于GLM是非常广泛的模型类别,因此如何解释GLM中的参数的问题非常广泛。回想一下,GLM对响应变量建模,假设该变量遵循指数族的已知分布,并且我们选择了可逆函数g使得 E [ yyg Ĵ预测变量 X。在该模型中,任何特定的参数的解释 β Ĵ是变化率Ý 相对于 X Ĵ。定义 μ &equiv; ë [ ÿ

E[y|x]=g1(x0+x1β1++xJβJ)
Jxβjg(y)xjη&equiv;X&CenterDot;&β以保持符号的清洁。然后,对于任何Ĵ{1...Ĵ} β Ĵ =μE[y|x]=g1(x)ηxβj{1,,J} 现在定义ëĴ为的矢量Ĵ-1零和单个1Ĵ个位置,使得例如如果Ĵ=5然后ë3=00100。然后 βĴ=ë [ ÿ
βj=ηxj=g(μ)xj.
ejJ11jJ=5e3=(0,0,1,0,0)
βj=g(E[y|x+ej])g(E[y|x])

βjηxj

E[y|x]xj=μxj=dμdηηxj=μηβj=dg1dηβj
E[y|x+ej]E[y|x]Δjy^=g1((x+ej)β)g1(xβ)

gβjηyxjyxjg1(β)


yPoisson(λ)g=ln

μxj=dg1dηβjg(μ)=ln(μ)g1(η)=eηdeηdη=eη

μxj=E[y|x]xj=ex0+x1β1++xJβJβj

最终意味着切实的东西:

xjy^y^βj

注意:这种近似值实际上适用于0.2的变化,具体取决于所需的精度。

Δjy^=ex0+x1β1++(xj+1)βj++xJβJex0+x1β1++xJβJ=ex0+x1β1++xJβJ+βjex0+x1β1++xJβJ=ex0+x1β1++xJβJejβex0+x1β1++xJβJ=ex0+x1β1++xJβJ(ejβ1)

xjy^y^(ejβ1)

这里有三个重要的注意事项:

  1. 预测变量的变化效果取决于响应的级别。
  2. 预测变量的累加变化会对响应产生乘法效应。
  3. 您不能仅通过阅读来解释系数(除非您可以在脑海中计算任意指数)。

lny^y^(e0.091) y^e0.091.09


我在这里做了一些调整,@ ssdecontrol。我认为它们会让您的帖子更容易理解,但是如果您不喜欢它们,请以我的歉意将其回退。
gung-恢复莫妮卡

我无法从我的答案中找出答案,那么显然我需要修改答案。您还困惑什么?
shadowtalker 2014年

就像线性回归一样,将这些数字插入方程式
shadowtalker 2014年

1
E[y|x]xyxjxj

2
而且不要想太多。一旦了解了GLM中的所有内容,此处的操作就只是微积分原理的直接应用。确实很简单,只要对您感兴趣的变量取导数即可
。– shadowtalker

3

我的建议是创建一个小的网格,该网格由两条河流和每个协变量的两个或三个值组成,然后将predict函数与一起使用newdata。然后绘制结果图。查看模型实际预测的值要清晰得多。您可能会或可能不希望将预测值反向转换为原始度量标准(type = "response")。


1
尽管我喜欢这种方法(我一直都这样做),但我认为这对建立理解起了反作用。
shadowtalker 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.