我有几个问题需要解释逻辑回归中连续变量的比值比。我觉得这些是关于逻辑回归的基本问题(可能还有关于回归的一般问题),尽管我为自己不知道答案感到as愧,但我还是要以我的骄傲为由并问他们,以便我在未来!
这是我的情况...我正在查看一个受审判的青年样本,作为试用期的一部分,他们参加了工作/生活技能培训计划。我想看看他们从计划中被释放的年龄在计划被释放六个月后的预期就业率。
(此外,请记住,模型中还有其他预测变量,但由于它们在统计上不显着,因此我将它们排除在外,我想尽可能地使之清晰。)
预测变量:从培训计划中释放的年龄(平均年龄= 17.4,SD = 1.2,范围14.3-20.5)
结果:是否就业(就业= 1,未就业= 0)
结果:赔率3.01(p <.005)(我已经排除了拟合优度等,因为我只寻求解释比值比的答案;我对模型拟合,CI的评估感到满意等)
简而言之:随着年龄增长一年,出院后六个月被雇用的几率增加了三个单位。
问题:
1)当我说“随着年龄的增长……”,年龄的起点是什么?
年龄从零开始吗?例如,“随着年龄从0开始增加(即,如果要将此模型放在图表上,则是最低年龄)...”
年龄是否从样本年龄范围内的最低年龄开始?例如,“随着年龄从14.3开始增加...”
要么
年龄是否从样本的平均年龄开始?例如,“随着年龄从17.4 ...开始增加”,
2)居中会帮助我解释这个结果,还是仅在解释y-int时有效?如果有帮助,我正在考虑进行平均居中或从样本中的所有其他年龄中减去该范围内的最低年龄。有什么建议么?
3)最后,是否恰当地说,与14岁的年轻人相比,17岁的年轻人受雇的可能性高9倍?我之所以问,是因为我知道逻辑回归假设为S型关系,并且我对这3个单位的几率增加是否在沿回归线的任何点都保持一致感到好奇。
非常感谢!
亚伦