在逻辑回归(或其他形式的回归)中测试非线性


13

Logistic回归的一种假设是logit中的线性。因此,一旦我建立了模型并开始运行,就可以使用Box-Tidwell测试来测试非线性。我的一个连续预测变量(X)对非线性进行了正面测试。我接下来该怎么办?

因为这违反了假设,所以我应该摆脱预测变量(X)或包括非线性变换(X * X)。还是将变量转换为分类变量?如果您有参考,也可以给我指出吗?

Answers:


8

我建议使用受限制的三次样条曲线(rcs在R中,请参见HmiscDesign包以获取使用示例),而不要增加X在您的模型中。例如,这种方法是Frank Harrell推荐的方法,您可以在他的关于回归建模策略的讲义(第2.5节和第9章)中找到一个很好的例证(请参见随附的网站)。

您可以使用汽车包装boxTidwell()中的与您的Box-Tidwell测试结果进行比较。

将连续预测变量转换为分类预测变量通常不是一个好主意,例如,参见“对连续变量进行分类引起的问题”


5

可能是适当的包括非线性变换X,但可能不是简单的X × X,即,X 2。我相信您可以在确定使用哪种转换时找到有用的参考:

GEP Box和Paul W.Tidwell(1962)。自变量的转换。Technometrics第4卷第4期,第531-550页。http://www.jstor.org/stable/1266288

一些人认为箱蒂德韦尔家庭转变的是普遍比通常适用于解释性和简约。帕特里克·罗伊斯顿(Patrick Royston)和道格·奥特曼(Doug Altman)在1994年的一篇有影响力的论文中介绍了具有简单有理数次的Box-Tidwell变换的分数多项式项:

P. Royston和DG Altman(1994)。使用连续协变量的分数多项式进行回归:简约参数化建模。《应用统计》第43卷:第429-467页。http://www.jstor.org/stable/2986270

帕特里克·罗伊斯顿(Patrick Royston)特别是继续为此工作并发表论文和软件,并最终与威利·绍尔布雷(Willi Sauerbrei)合着了一本书:

P. Royston和W.Sauerbrei(2008)。多变量模型构建:一种基于分数多项式的回归分析的实用方法,用于对连续变量进行建模。英国奇切斯特:威利。ISBN 978-0-470-02842-1


4

不要忘记检查X和其他自变量之间的交互。如果不进行交互,则当X仅具有非加性时,会使X看起来具有非线性效果。


好点子。我只遇到了相反的情况:假设一个效应在不是线性的情况下是线性的,这可能导致乘法交互项的虚假统计证据。
一站式

1
@onestop,您对此有参考吗?我相信,但是我很难弄清为什么会发生这种情况。
2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.