用分类数据解释负二项式GLM的.L和.Q输出


14

我只是运行负二项式GLM,这是输出:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

我的预测变量都是绝对的。这就是为什么我要.L.Q。我假设它们代表不同的类别,但是在运行GLM之前,有人知道我可以使用代码对它们进行标记,以使它们显示为不同的类别吗?



我发现该代码令人困惑,是否有更简单的代码?类别非常简单:方法1和方法2,站点1,站点2和站点3,深度为5、10和15
Vivienne

Answers:


13

您的变量不仅被编码为因子(使其成为分类变量),还被编码为有序因子。然后,默认情况下,R使一系列多项式函数适合变量的级别。第一个是线性(.L),第二个是二次(.Q),第三个是(如果您有足够的水平)将是三次,依此类推。R将比该变量中的水平数少拟合一个多项式函数。例如,如果您只有两个级别,则只能拟合线性趋势。此外,所使用的多项式基是正交的。(就其价值而言,所有这些都不是特定于R或负二项式模型的,所有软件和回归模型的类型都可以做到这一点。)


专门针对R,如果您希望变量被编码为有序或无序,则可以使用?factor

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor

哦,我已经订购了它们,现在它上面贴有标签,非常感谢您!
薇薇安(Vivienne)2016年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.