“逐步回归”如何工作?


11

我使用以下R代码来拟合概率模型:

p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1)
stepwise(p1, direction='backward/forward', criterion='BIC')

我想知道到底是做什么stepwisebackward/forward做什么,以及如何选择变量?



4
除了BabakP的链接之外,还可以查看该站点上的这篇文章
COOLSerdash

3
关于步进问题(以及前进和后退)的另一篇文章是我与戴维·卡塞尔(David Cassell)撰写的一篇文章:步进停止
Peter Flom-恢复莫妮卡

@PeterFlom,为了参考本文,我在理解正确的引文时遇到了一些问题。您能在这里列出吗?谢谢。
doug.numbers 2014年

2
@ doug.numbers它出现在各个地方,并作为会议论文集的一部分出版。如果您使用Google“ Flom,Cassell,Stepwise”,您将获得它的展示位置,并且可以对它进行格式设置,但是可以将引用格式设置为已发布的演示文稿。
彼得·弗洛姆

Answers:


10

逐步选择原理

  1. 您可以使用所需的所有变量来拟合模型。这是您当前最好的模型。
  2. 根据BIC(或任何其他方法),您删除一个变量(或在当前最佳模型中未使用的变量中添加一个),然后为每个变量拟合新模型,然后将它们与每个模型和原始模型进行比较。其他标准,例如AIC)。您将获得另一个“当前最佳模型”。

您重复2.直到BIC不变。您只有局部最小值的BIC,这意味着您可能无法在所有变量子集的选择中获得最佳模型。但是无论如何,通常它们太多了,因此这是一种无需太多工作即可进行优化的方法。

另请参阅Wikipedia上的逐步回归模型选择


5

逐步回归基本上可以通过基于指定条件(一次在您的示例中,该条件基于BIC)添加/删除一个协变量来拟合回归模型。

通过指定正向,您告诉R您要从最简单的模型(即一个协变量)开始,然后一次添加一个协变量,仅保留那些会改善模型BIC的变量。

通过向后指定,您会告诉R您要从完整模型(即具有所有协变量的模型)开始,然后丢弃协变量一次,这将导致BIC的改善。

逐步回归可能是一个非常危险的统计过程,因为它不是最佳的模型选择过程。该方法可能会导致模型选择非常差,因为它不能保护您免受多重比较之类的问题的困扰。


谢谢。那“后退/前进”呢?
Mahmoud13年

你是什​​么意思后退/前进?

R中stpewise()的方法之一是“向后/向前”!两者结合吗?
Mahmoud 2013年

2
抱歉,现在我明白了您的要求。是的,如果您同时指定了两者,则它将向前和向后应用,并选择具有最佳标准的一个。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.