模型选择中AIC和p值的等效性


9

在对这个问题的答案的评论中,有人指出在模型选择中使用AIC等于使用p值为0.154。

我在R中进行了尝试,在其中我使用了“向后”子集选择算法来排除完整规范中的变量。首先,依次丢弃具有最高p值的变量,并在所有p值均低于0.154时停止,其次,然后删除该变量,删除该变量会导致AIC最低,直到无法进行改进为止。

原来,当我使用0.154的p值作为阈值时,它们给出的结果大致相同。

这是真的吗?如果是这样,是否有人知道原因或可以参考解释它的来源?

PS我不能要求对方发表评论或发表评论,因为刚刚注册。我知道这不是最适合模型选择和推断的方法。


(1)使用Logistic回归分析的预测模型:小数据集中选择和估计方法的比较。根据Aic定义,对于拥有df1的变量而言,Statistics in Medicine,19,1059-1079(2)为true。但是,如果您的变量自由度较高,则可能会更低
查尔斯·

Answers:


13

使用统计测试或AIC完成变量选择存在很大问题。如果使用测试,则AIC会使用 = 2.0 的临界值,它对应于。在单个变量上使用AIC并没有什么新内容;它只是使用比0.05 更合理的。一个更合理的(较少干扰)的为0.5。χ2χ2α=0.157αα


+1我花了很长时间来构造我的答案(现已删除),但我什至没有看到与此同时发布的答案。我本来只是投票赞成这一票。
Glen_b-恢复莫妮卡2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.