研究逻辑回归的稳健性,以防止违反逻辑线性


10

我正在执行具有二进制结果(启动和不启动)的逻辑回归。我混合的预测变量都是连续变量或二分变量。

使用Box-Tidwell方法,我的连续预测变量之一可能违反了logit线性的假设。拟合优度统计没有迹象表明拟合是有问题的。

随后,我再次运行回归模型,将原始连续变量替换为:首先是平方根变换,其次是变量的二分形式。

在检查输出时,拟合优度似乎略有提高,但残差成为问题。参数估计值,标准误差和仍然相对相似。在我的假设中,在这三个模型中,数据的解释都没有改变。exp(β)

因此,就我的结果的实用性和数据解释的意义而言,似乎应该使用原始的连续变量来报告回归模型。

我想知道这一点:

  1. Logistic回归何时能抵抗logit假设线性度的潜在违反?
  2. 鉴于我上面的示例,在模型中包括原始连续变量似乎可以接受吗?
  3. 有什么参考或指南可以推荐何时可以令人满意地接受模型对潜在的logit线性违反的鲁棒性?

Answers:


16

线性假设在回归中经常被违反,因此应该称其为意外而不是假设。像其他回归模型一样,当您错误地假设线性时,逻辑模型对非线性也不可靠。与其使用残差或综合拟合优度来检测非线性,不如使用直接测试。例如,使用回归样条线扩展连续的预测变量,并对所有非线性项进行复合测试。最好还是不要测试这些条件,而只是期望非线性。这种方法比尝试使用不同的单斜率转换(例如平方根,对数等)要好得多,因为在这种分析之后统计推断会不正确,因为它没有足够大的分子自由度。

这是R中的一个例子。

require(rms)
f <- lrm(y ~ rcs(age,4) + rcs(blood.pressure,5) + sex + rcs(height,4))
# Fits restricted cubic splines in 3 variables with default knots
# 4, 5, 4 knots = 2, 3, 2 nonlinear terms
Function(f)   # display algebraic form of fit
anova(f)      # obtain individual + combined linearity tests

您的回答很有道理-谢谢!您能否建议在SPSS中使用语法?我很遗憾没有获得(或技能)利用R.
短伊丽莎白

1
学习R绝对是值得的,并且我有很多与逻辑建模和rms软件包有关的讲义。在SPSS中很难做到这一点。
Frank Harrell 2013年

@FrankHarrell:该f <- lrm(y ~ ...行出现错误object 'y' not found-您可以解决吗?
arielf

1
这是一个非常基本的R错误,并非我的rms包装所独有。从了解基本回归lm函数的大量材料开始,花一些时间来了解R。
Frank Harrell 2013年

1
软件帮助页面中内置的示例可模拟此类数据,因此请在上下文中查看整个示例。不要require(rms)?lrm那么examples(lrm)
弗兰克·哈瑞尔
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.