在逻辑回归分析中,对于连续自变量,我应如何检查对数线性的假设?


13

我对逻辑回归分析中连续预测变量的logit线性假设感到困惑。在使用单变量logistic回归分析筛选潜在预测指标时,我们是否需要检查线性关系?

就我而言,我正在使用多元逻辑回归分析来确定参与者中与营养状况(二分结果)相关的因素。连续变量包括年龄,Charlson合并症评分,Barthel指数评分,握力,GDS评分,BMI等。我的第一步是使用简单的逻辑回归筛选重要变量。在每个连续变量的简单逻辑回归分析过程中,是否需要检查线性假设?还是应该在最终的多元逻辑回归模型中进行检查?

此外,据我了解,我们需要先将非线性连续变量转化为模型,然后再进行转换。我可以对非线性连续变量进行分类而不是进行转换吗?


1
你应该分类,不如试试样条!
kjetil b halvorsen

Answers:


11

正如我在《回归建模策略》(第二版,2015-09-04,现已提供电子书)中详细描述的那样,在建模之前尝试转换变量的过程充满了问题,最重要的问题之一就是失真类型I的误差和置信区间。分类会导致更严重的问题,尤其是缺乏适应性和任意性。

与其将其视为“缺少契合性的检查”问题,不如将其视为指定非常适合的模型。做到这一点的一种方法是将参数分配给模型的那些可能很强并且线性度未知的合理假设。在此过程中,将检查有效样本大小(在您的情况下为事件数量和非事件数量的最小值),并在数据信息内容允许的范围内允许复杂性(例如使用15:1 events:parameter规则)的经验)。通过预先指定一个灵活的加性参数模型,只需忽略重要的相互作用就可以解决问题。一般而言,互动应预先指定。

您可以通过正式测试(使用R rms包使之变得容易)来检查模型中是否需要非线性,但是当无关紧要时删除这些术语会产生我在上面概述的推断失真。

http://biostat.mc.vanderbilt.edu/rms链接的课程笔记中可以找到更多详细信息。


抱歉,之前没有提到,但我对R不熟悉,并且正在使用SPSS进行分析。从提供的解决方案中,是否意味着如果我使用有效样本量(15:1),就可以包括所有重要因素(来自评论)而无需检查其线性度?
Sze Lin Tan

根据我在本例中所做的单变量logistic回归分析,BMI,小腿围,上臂中上围均对营养状况的简单logistic回归模型做出了重大贡献(p <0.05)。但是当我使用Box-Tidwell方法(对于每个简单的逻辑模型)检查假设时,他们发现并没有满足线性假设。因此,我不确定是否应该使用这些预测变量进行多重逻辑回归分析。
Sze Lin Tan

5
基于单变量分析建立模型是无效的。您正在使用变体进行逐步回归,这已知会导致许多问题。
Frank Harrell


1

我认为我们应该绘制连续变量并在回归模型中使用它们之前检查线性。如果线性似乎是一个合理的假设,那么我认为在大多数情况下,最终的多变量回归模型中仍将保持这种线性;如果不是,我认为这可能主要是由您可以校正的相互作用引起的。

是的,对非线性连续变量进行分类是一种选择。问题在于,在大多数情况下,类别似乎是任意的,并且类别之间的截断分数之间的细微差异可能会导致不同的结果(尤其是关于统计显着性),并且取决于类别的数量和数据的大小,您可能会丢失数据中的许多有价值的信息。

一种替代方法是使用广义加性模型,该模型是可以指定为逻辑回归的回归模型,但是可以将非线性自变量包括为“平滑函数”。从技术上讲,这在R中不是很复杂,但是我对其他软件包一无所知。这些模型将识别与因变量的非线性关系,但是缺点可能是您不会在输出中得到整洁的数字,而只是通过可视化曲线测试了统计显着性。因此,这取决于您对量化非线性变量对结果变量的影响的兴趣如何。

最后,至少在使用R的情况下,可以使用如上所述的广义加性模型来测试逻辑回归模型中的线性假设。

看一看这本书(与您和我的领域完全不同,但这一点都没有关系):http : //www.amazon.com/Effects-Extensions-Ecology-Statistics-Biology/dp/0387874577 / ref = sr_1_1?ie = UTF8&qid = 1440928328&sr = 8-1&keywords = zuur + ecology


我不熟悉R,并且正在使用SPSS进行分析。抱歉,之前没有提到。是否可以使用Box-Tidwell方法(通过在连续变量与其自身的自然对数之间创建交互项并将交互项添加到模型中)来检查线性假设?
Sze Lin Tan

1

由于我不知道您的数据,因此不知道将这三个变量(基本变量,自然对数和交互式术语)组合在一起是否会出现问题。但是,我知道,过去考虑组合三个术语时,我经常会失去对所测量内容的概念性跟踪。您需要对所测量的内容有很好的了解,否则将难以解释您的发现。希望有帮助!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.