我正在执行具有二进制结果(启动和不启动)的逻辑回归。我混合的预测变量都是连续变量或二分变量。
使用Box-Tidwell方法,我的连续预测变量之一可能违反了logit线性的假设。拟合优度统计没有迹象表明拟合是有问题的。
随后,我再次运行回归模型,将原始连续变量替换为:首先是平方根变换,其次是变量的二分形式。
在检查输出时,拟合优度似乎略有提高,但残差成为问题。参数估计值,标准误差和仍然相对相似。在我的假设中,在这三个模型中,数据的解释都没有改变。
因此,就我的结果的实用性和数据解释的意义而言,似乎应该使用原始的连续变量来报告回归模型。
我想知道这一点:
- Logistic回归何时能抵抗logit假设线性度的潜在违反?
- 鉴于我上面的示例,在模型中包括原始连续变量似乎可以接受吗?
- 有什么参考或指南可以推荐何时可以令人满意地接受模型对潜在的logit线性违反的鲁棒性?