我建立了Logistic回归,其中在接受治疗后(Cure
vs. No Cure
)治愈了结果变量。本研究中所有患者均接受治疗。我有兴趣查看是否患有糖尿病与该结局有关。
在R中,我的逻辑回归输出如下所示:
Call:
glm(formula = Cure ~ Diabetes, family = binomial(link = "logit"), data = All_patients)
...
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.2735 0.1306 9.749 <2e-16 ***
Diabetes -0.5597 0.2813 -1.990 0.0466 *
...
Null deviance: 456.55 on 415 degrees of freedom
Residual deviance: 452.75 on 414 degrees of freedom
(2 observations deleted due to missingness)
AIC: 456.75
但是,优势比的置信区间包括1:
OR 2.5 % 97.5 %
(Intercept) 3.5733333 2.7822031 4.646366
Diabetes 0.5713619 0.3316513 1.003167
当我对这些数据进行卡方检验时,我得到以下信息:
data: check
X-squared = 3.4397, df = 1, p-value = 0.06365
如果您想自行计算,则治愈和未治愈组的糖尿病分布如下:
Diabetic cure rate: 49 / 73 (67%)
Non-diabetic cure rate: 268 / 343 (78%)
我的问题是:为什么p值和包括1的置信区间不一致?
糖尿病的置信区间是如何计算的?如果使用参数估计和标准误差来形成Wald CI,则将exp(-。5597 + 1.96 * .2813)= .99168作为上限。
—
hard2fathom 2015年
@ hard2fathom,最有可能使用的OP
—
gung-恢复莫妮卡
confint()
。即,可能性被剖析。这样,您将获得类似于LRT的CI。您的计算是正确的,但应构成Wald CI。我在下面的答案中有更多信息。
在更仔细地阅读后,我投票了。说得通。
—
hard2fathom 2015年