将非嵌套模型与AIC进行比较


19

假设我们必须使用GLMM

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

这些模型不是通常意义上的嵌套:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

因此我们不能像做anova(mod1, mod2)那样做anova(a ,b)

我们可以用AIC来说哪个是最好的模型吗?

Answers:


24

AIC可以应用于非嵌套模型。实际上,这是关于AIC的最广泛的神话(误解?)之一。看到:

您必须要注意的一件事是包括所有归一化常数,因为对于不同的(非嵌套)模型,这些常数是不同的:

也可以看看:

在GLMM的背景下,一个更微妙的问题是AIC在比较这种模型时有多可靠(另请参阅@ BenBolker's)。以下白皮书讨论并比较了AIC的其他版本:


2
请注意,在尝试比较随机效应集
Ben Bolker 2014年

@Chandelier和Ben Bolker非常感谢您的两个回答。你们中的任何一个碰巧对以这种方式使用AIC的说法有更正式的参考吗?
user1322296 2014年

2
@ user1322296我建议您扎根,这是赤池的论文。获得AIC作为模型与“真实模型”之间差异的估计。因此,没有嵌套的假设,只有一些规则性条件。
枝形吊灯

因此,比较lm1 = x〜A + B C和lm2 = x〜D + B C的AIC是否有效?谢谢
crazjo 2014年

似乎有些非嵌套模型不适用于AIC。这是两个示例:12。您能否提供一些在什么条件下可以使用非嵌套模型?
卡尔,

10

作为参考,提出了反驳:Brian Ripley在第6-7页的“从大型模型中选择”中指出

重要假设 ...模型是嵌套的(脚注:请参阅Akaike(1973)重印中第615页的底部)。–不使用AIC时被广泛使用

我认为相关的段落(也是Akaike的另一篇重印的第204页)开头是这样的短语:“统计模型识别的问题通常被表述为选择 ...的问题...”)这里不太可用; 我正在寻找论文的PDF,所以我可以在这里引用文章...FX|ķθ

Ripley,BD,2004年。“从大类模型中选择。”《统计方法与模型》,N。Adams,M。Crowder,D.J Hand和D.Stephens编辑,155-70。伦敦,英国:帝国学院出版社。

Akaike,H.(1973)信息理论和最大似然原理的扩展。在第二届国际信息理论研讨会上(Eds BN Petrov和F.Cáski),第267-281页,布达佩斯。AkademiaiKaidó。转载于《统计突破》 ,科兹编辑。&约翰逊(NL)(1992),第I卷,第599-624页。纽约:施普林格。


3

Akaike似乎认为AIC是比较非嵌套模型的有用工具。

“关于AIC的一个重要发现是,它的定义没有明确参考真实模型[f(x |kθ)]。因此,对于任何数量有限的参数模型,我们都可以始终考虑一个扩展模型,该模型将扮演[f(x |kθ)]这表明AIC至少在原则上可用于比较非嵌套模型,即,传统对数似然比检验不适用的情况。

(Akaike 1985,第399页)

赤池弘彦。“预测和熵。” 赤池浩文论文精选。1985年,纽约,纽约,斯普林格。387-410。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.