AIC选型指南


32

我通常使用BIC,因为我的理解是与AIC相比,它更重视简约。但是,我现在决定使用一种更全面的方法,并且也希望使用AIC。我知道Raftery(1995)为BIC差异提出了很好的指导原则:0-2弱,2-4是一个模型更好的积极证据,依此类推。

我在教科书上看过,它们在AIC上似乎很奇怪(看起来差异较大,AIC差异较小意味着一个模型更好)。这违背了我所学的知识。我的理解是您希望降低AIC。

有谁知道Raftery的指南是否也适用于AIC,或者我会在哪里引用某个模型相对于另一个模型的“证据强度”指南?

是的,临界值并不是很好(我觉得它们很恼人),但是在比较不同种类的证据时它们很有用。


1
这是(pdf),您指的是Raftery论文吗?
gung-恢复莫妮卡

4
这里的读者可能有兴趣阅读以下出色的CV主题:是否有任何理由比其他更喜欢AIC或BIC?
gung-恢复莫妮卡

1
当您说“ 我看过教科书时,它们在AIC上看起来很奇怪(看起来差异较大但AIC的较小差异表示一个模型更好)时,您指的是哪些教科书” ---它们实际上是什么说?
Glen_b-恢复莫妮卡2014年

1
您的第二段不清楚。您可能会这样说:虽然较大的差异表明值较小的模型是可取的,但较小的差异却难以评估。此外,统计学家尚未就“小”或“大”的差异达成共识-Singer and Willet(2003,p.122)
冬眠

1
关于您的第三段,如果您想采用Jeffreys(1961,p。432)提出的证据强度类别,我可以为您提供全面的参考。
冬眠

Answers:


23

AIC和BIC在模型比较方面具有相同的解释。也就是说,AIC或BIC的差异越大,表明一种模型优于另一种模型的证据越强(越低越好)。只是AIC不会像BIC那样严厉地惩罚参数数量。AIC(AICc)也有一个更小的样本量校正。可以在此处找到有关AIC / BIC比较的更多信息。


5
+1。补充说明一下:AIC(和AICc)采用KL散度。因此,正是因为AIC反映“附加”信息,所以它越小越好。换句话说,当我们的样本量,具有最小AIC得分的模型将具有最小的Kullback-Leibler散度,因此将成为最接近“真实”模型的模型。N
usεr11852恢复单胞菌说,

28

您正在谈论两种不同的事物,并且正在将它们混淆。在第一种情况下,您有两个模型(1和2),并且获得了它们的AIC,如和。如果要基于其AIC比较这两个模型,则首选AIC较低的模型,即,如果则选择模型1,反之亦然。 在第二种情况下,您拥有一组候选模型,例如模型并且对于每个模型,您都将AIC差异计算为,其中是第个模型,而是所有模型中最小的AIC。现在模型ç 2ç 1 < Ç 21 2 Ñ Δ = Ç - ç ÑÇ Ç 中号ñ Δ > 10 Δ Δ AIC1AIC2AIC1<AIC2
(1,2,...,n)Δi=AICiAICminAICiiAICminΔi>10没有支持,可以忽略,如肯尼思·伯纳姆(Kenneth P. Burnham),戴维·R·安德森(David R. Anderson)第71页的《模型选择和多模型推理:实用的信息理论方法》中所述。,较弱的将是您的模型。这里最好的模型是ΔiΔiΔmin0.


1
啊哈!这完全清除了“大于”位。谢谢!
汤姆·卡彭特

7

我通常从不客观地使用AIC或BIC来描述模型的适当拟合。我确实使用这些IC来比较两个预测模型的相对拟合。至于AIC是“ 2”还是“ 4”,它完全是上下文。如果您想了解“好”模型的适合程度,则可以(应该)始终使用模拟。您对AIC的理解是正确的。AIC 从参数中获得贡献,而从可能性中获得贡献。您想做的是在不使用大量参数加载模型的情况下最大程度地提高可能性。因此,我的泡沫破灭观点是,AIC的门槛在上下文之外是没有好处的。


如果您的模型不允许任何模拟怎么办?
2014年

6
啧啧啧!这怎么可能呢?一个人可以引导世界。
AdamO 2014年

上帝的运气...模拟世界大声笑
Stat 2014年

2
@Stat当我说我无法设想无法模拟模型数据的情况时,我非常认真。至少,从训练数据集进行引导符合有效的模拟方法的资格。
AdamO 2014年

当引导程序很难进行交叉验证时,甚至应该使用简单的技巧即可。此外,模型平均还提供一种从具有相似AIC的模型中协调信息的方法。
N Brouwer'2

2

这是一个相关的问题,何时通过最小化aic来适当地选择模型?。它为您提供了一个大致的概念,即哪些在学术界不知名的人认为合适的写作方式以及留下哪些重要的参考资料。

通常,重要的是可能性或AIC之间的差异,而不是其绝对值。您已经错过了问题中“ BIC:0-2弱”中的重要词“差异”,请查看Raftery的表6,并且很奇怪,没有人想要纠正这一点。

我本人已被教导要寻找MAICE(AIC估算的最小值-如Akaike所称)。所以呢?这是一位名人写给一位不知名女士的信:

Dear Miss -- 
I have read about sixteen pages of your manuscript ... I suffered exactly the same 
treatment at the hands of my teachers who disliked me for my independence and passed 
over me when they wanted assistants ... keep your manuscript for your sons and
daughters, in order that they may derive consolation from it and not give a damn for
what their teachers tell them or think of them. ... There is too much education
altogether.

我的老师从未听说过标题为“测试两个AIC是否显着不同”的论文,我什至不记得他们曾经称AIC为统计数据,该统计数据具有抽样分布和其他属性。有人告诉我,AIC是可以自动执行的最小化标准。

我认为几年前爱尔兰统计局曾在这里表达过另一个重要问题(如果我未能找到答案,我会从记忆中道歉,如果我没有找到答案),是出于不同的目的得出了AIC,BIC和其他标准,例如,在不同的条件(假设)下,您通常不能互换使用它们。您不能只喜欢不适当的东西。

我的资料显示,我引用伯纳姆和安德森(Burnham and Anderson,2002,第70页)来表示0-2之内的增量(AIC差异)具有实质性支持;4-7之内的差值大大少于支持,而大于10的差值基本上没有支持。另外,我写道:“作者还讨论了这些准则可能有用的条件”。Stat的答案引用了这本书,我认为这是最相关的。


0

关于信息标准,SAS表示:

“请注意,可以使用Akaike(AIC),Schwarz(SC,BIC)和QIC之类的信息标准来比较竞争性的非嵌套模型,但不能提供比较的检验。因此,它们无法表明一个模型是否显着GENMOD,LOGISTIC,GLIMMIX,MIXED和其他过程提供了信息标准度量。”

有两种比较模型测试程序:a)Vuong检验和b)非参数Clarke检验。有关详细信息,请参见本文


我发现引用的“论文”(即演示文稿)中使用的数学符号是无法理解的,无需评论。特别是,虚线表示什么?意义?
亚当·里奇科夫斯基
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.