因此,我知道变量选择是模型选择的一部分。但是,模型选择究竟由什么组成?它不只是以下内容:
1)为您的模型选择一个分布
2)选择解释变量
我之所以这么问,是因为我正在阅读伯纳姆和安德森的文章:AIC与BIC,他们在模型选择中谈论AIC和BIC。阅读本文后,我意识到我一直在将“模型选择”视为“变量选择”(参考注释BIC是否试图找到一个真正的模型?)
从文章摘录中,他们讨论了“通用性”程度不断提高的12个模型,当针对12个模型绘制KL-Information时,这些模型显示出“渐缩效应”(图1):
不同的哲学和目标模型 ...尽管BIC的目标比AIC的目标模型更通用,但是BIC在这里最常选择的模型将不如Model 7通用,除非n非常大。它可能是模型5或模型6。众所周知(从大量的论文和模拟文献中),在渐缩效应的情况下(图1),AIC的性能优于BIC。如果这是真实数据分析的上下文,则应使用AIC。
如何BIC 曾经选择一个模型,模型选择我不明白,比AIC更复杂!什么是“模型选择”?什么时候BIC选择比AIC更“通用”的模型?
如果我们谈论的是变量选择,那么BIC必须确保始终选择变量数量最少的模型,对吗?BIC中的项总是比AIC中的项对附加变量的惩罚更多。但是,当“ BIC的目标是比AIC的目标模型更通用的模型 ”时,这是否合理?
编辑:
从“意见”中评论的讨论中,是否有理由比其他更喜欢AIC或BIC?我们在评论中看到了@Michael Chernick和@ user13273之间的一小段讨论,这使我相信这并不是一件小事:
我认为将这种讨论称为“特征”选择或“协变量”选择更为合适。对我而言,模型选择范围更广,涉及到误差分布的规范,链接函数的形式以及协变量的形式。当我们谈论AIC / BIC时,通常会处于模型构建的所有方面都是固定的情况,除了协变量的选择。– user13273 2012年8月13日在21:17
确定要包含在模型中的特定协变量通常是用模型选择一词来完成的,书名中有许多带有模型选择的书主要决定了模型中应包含哪些模型协变量/参数。–迈克尔·切尔尼克(Michael Chernick)2012年8月24日14:44