报告逻辑回归的结果


13

我有以下逻辑回归输出:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

是否可以通过以下方式进行报告:

Beta系数,赔率,Zvalue,P值。如果是,我如何获得赔率?


Answers:


9

尽管z值和p值是多余的,但您建议的表报告似乎是合理的。我熟悉的许多期刊根本不报告z值/ p值,而仅使用星号报告统计意义。我还看到了仅报告了奇数比的逻辑表格,尽管我个人更喜欢对数比数和在空间允许的情况下报告的奇数比。

但是不同的场所对于报告程序可能有不同的指南,因此预期的结果可能会有所不同。如果我要向期刊提交论文,我会经常看到其他最近发表的论文是如何制成表格并模仿它们的。如果这是您自己的个人论文,问问可能正在审查的人是一个合理的要求。如前所述,某些场所的空间限制可能会阻止您报告最终的冗余信息(例如对数赔率和赔率比)。有些地方可能会迫使您完全以文本形式报告结果!

还有一个问题是要报告哪些其他模型摘要。虽然许多杂志我所熟悉的频繁报告伪的值,这里是一个讨论的各种措施的弱点,在网站上线。我个人更希望报告分类率,但是我再次怀疑这会因地点而异(我可以想象某些期刊会专门要求报告伪度量之一)。R 2R2R2

要获得奇数比,只需对回归系数求幂(即,使用,其中是自然对数的底,而是估计的logistic回归系数。)用任何统计语言来计算这是。 Ë βeβ^eβ^exp(coefficient)

另外,尽管这是当前公认的答案,但lejohn和Frank Harrell都给出了非常有用的建议。虽然我通常总是希望将问题的统计数据报告在某处,但其他答案的其他建议则是评估相对于模型中其他估计效果的效果大小的有用方法。图形化程序也可用于检查相对效果的大小,并以这两篇关于将表格转换为图表的示例为例(Kastellec&Leoni,2007Gelman等,2002)。


该Kastellec和莱尼,2007链接是破产了,但这里是从代码相同的用纸的一个例子。
ACNB

11

该问题的答案可能取决于您的学科背景。

以下是一些一般注意事项。

logistic回归中的beta很难直接解释。因此,明确报告它们的用途非常有限。您应该坚持优势比甚至边缘效应。变量x的边际效应是因变量相对于x等于1的概率的导数。这种表示结果的方式在经济学家中非常流行。我个人认为,外行人员(但不仅限于他们)比边际比率更容易理解边际效应。

另一个有趣的可能性是使用图形显示。盖尔曼(Gelman)和希尔(Hill)这本书是您可以找到有关此方法的一些插图的地方。我发现这比报告边际效应更好。

关于如何获得比值比的问题,这是如何在R中做到这一点:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

您有没有将边际效应估计值转换为表格的示例(或Gelman和Hill中的特定页面引用?)
Andy W

1
Gelman和Hill并未真正使用边际效应,而是使用了基于预测概率的图表。看看第五章,起始于第79页

10

仅在特殊情况下,系数及其反对数(奇数比)才是很好的汇总。这是当这些关系是线性的并且有一个与预测变量相关的系数时,并且当一个单位的变化是计算比值比的良好基础时(年龄更大,对白血球计数范围不大的情况就没那么多了) 500-100,000)。通常,四分位间距比值之类的东西很有用。我在http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf上有关于此的更多详细信息,R rms程序包会自动完成所有这些操作(处理非线性项和相互作用,计算X的四分位数,等等。)。


5

这可能取决于您的听众和纪律。下面的答案是流行病学期刊和较小程度的医学期刊通常要做的事情。

直言不讳,我们不在乎p值。说真的,我们没有。除非您有非常迫切的需求,流行病学甚至不会让您报告这些疾病,并且该领域基本上已经紧随其后。

根据问题的不同,我们甚至可能不在乎Beta估算值。如果您的报告涉及的是方法论或模拟方面的问题,那么我可能会报告Beta估算值和标准误差。如果您要报告总体中的估计效果,我会坚持赔率和95%置信区间。这就是您的估算依据,也是该领域读者所需要的。

上面已经发布了有关如何获得优势比的答案,但对于OR和95%CI:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

感谢您的回答!请问1.96在计算中代表什么?
2011年

1
没问题:) 95%的置信区间应该大致覆盖beta估计值的正态分布的第2.5个百分点到第97.5个百分点。这些点中的每一个都与平均值(在本例中为beta)相差约1.96标准偏差。
Fomite,2011年

是的,但是我应该针对每个Beta系数执行此操作吗?1.96也会改变吗?也是二项式数据,它仍然基于正态分布吗?
2011年

2
是的-对于每个beta系数,您都可以获得比值比和95%的置信度限制。除非您要为置信区间计算一个不同的百分位数(90%,99%等),否则1.96不会更改,但是由于95%是标准值,因此无需这样做。只要您使用对数刻度,对数回归模型的参数就可以正态分布。一旦对它们求幂,这便不再成立。
Fomite 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.