我正在使用二项式逻辑回归来确定是否暴露has_x
或has_y
影响用户点击某事的可能性。我的模型如下:
fit = glm(formula = has_clicked ~ has_x + has_y,
data=df,
family = binomial())
这是我模型的输出:
Call:
glm(formula = has_clicked ~ has_x + has_y,
family = binomial(), data = active_domains)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.9869 -0.9719 -0.9500 1.3979 1.4233
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.504737 0.008847 -57.050 < 2e-16 ***
has_xTRUE -0.056986 0.010201 -5.586 2.32e-08 ***
has_yTRUE 0.038579 0.010202 3.781 0.000156 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 217119 on 164182 degrees of freedom
Residual deviance: 217074 on 164180 degrees of freedom
AIC: 217080
Number of Fisher Scoring iterations: 4
由于每个系数都很重要,因此使用此模型,我可以使用以下方法判断这些组合中的任何一个的值:
predict(fit, data.frame(has_x = T, has_y=T), type = "response")
我不了解如何报告性病。预测错误。
我仅需要使用吗?或者我需要转换的 小号Ë使用所描述的方法在这里?
如果我想了解两个变量的标准误差,我将如何考虑?
重复: stats.stackexchange.com/questions/5304/...
—
的Kjetil b HALVORSEN
@kjetilbhalvorsen您确定它是重复项,因为OP似乎想要一个预测间隔,但似乎在OR尺度而不是对数尺度上工作,这可能是问题的根源?
—
mdewey
如果要评估逻辑回归的预测效果,通常使用与预测+ SE不同的方法。一种流行的评估方法是将ROC曲线与AUC一起使用
—
-adibender