Logistic回归:解释连续变量


11

我有几个问题需要解释逻辑回归中连续变量的比值比。我觉得这些是关于逻辑回归的基本问题(可能还有关于回归的一般问题),尽管我为自己不知道答案感到as愧,但我还是要以我的骄傲为由并问他们,以便我在未来!

这是我的情况...我正在查看一个受审判的青年样本,作为试用期的一部分,他们参加了工作/生活技能培训计划。我想看看他们从计划中被释放的年龄在计划被释放六个月后的预期就业率。

(此外,请记住,模型中还有其他预测变量,但由于它们在统计上不显着,因此我将它们排除在外,我想尽可能地使之清晰。)

预测变量:从培训计划中释放的年龄(平均年龄= 17.4,SD = 1.2,范围14.3-20.5)

结果:是否就业(就业= 1,未就业= 0)

结果:赔率3.01(p <.005)(我已经排除了拟合优度等,因为我只寻求解释比值比的答案;我对模型拟合,CI的评估感到满意等)

简而言之:随着年龄增长一年,出院后六个月被雇用的几率增加了三个单位。

问题:

1)当我说“随着年龄的增长……”,年龄的起点是什么?

年龄从零开始吗?例如,“随着年龄从0开始增加(即,如果要将此模型放在图表上,则是最低年龄)...”

年龄是否从样本年龄范围内的最低年龄开始?例如,“随着年龄从14.3开始增加...”

要么

年龄是否从样本的平均年龄开始?例如,“随着年龄从17.4 ...开始增加”,

2)居中会帮助我解释这个结果,还是仅在解释y-int时有效?如果有帮助,我正在考虑进行平均居中或从样本中的所有其他年龄中减去该范围内的最低年龄。有什么建议么?

3)最后,是否恰当地说,与14岁的年轻人相比,17岁的年轻人受雇的可能性高9倍?我之所以问,是因为我知道逻辑回归假设为S型关系,并且我对这3个单位的几率增加是否在沿回归线的任何点都保持一致感到好奇。

非常感谢!

亚伦


1
您可能会感兴趣这个
tchakravarty 2014年

4
删除“无关紧要”的变量非常成问题。
2014年

@FrankHarrell您能详细说明为什么在这种情况下删除无关紧要的变量会带来很大问题吗?
马克·怀特

本站点对此进行了详细讨论。简言之它破坏标准误差,P值,置信区间覆盖等
弗兰克·哈瑞尔

Answers:


6

1)由于这是优势比,因此无论您从哪里开始都没关系。18岁的几率是17岁的几率。或者17岁的几率是18岁的几率。一样。如果要获得雇用特定年龄人员的可能性,则可以将公式与参数估计一起使用(而不是OR)。或者,您可以获取正在使用的程序。

2)居中是否有帮助是一个意见问题。我没有找到更清晰的中心模型,但是有人知道。

3)赔率与“可能”的赔率并不完全相同(尽管很多人都说得像),而17岁的赔率将是14岁的赔率。

最后,我会对这种模型保持谨慎。该模型假设OR在14和15、15和16之间相同,依此类推。根据我对该主题的了解,这对我来说似乎不太可能。


0

在保持所有其他变量不变的情况下,一个人参加培训问题的平均几率是另一名年轻/大一岁的人的几率的#倍。

那是我的看法。


1
您能否进一步说明如何将其添加到上一个答案中?
mdewey
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.