解释AIC值


9

我在逻辑模型中看到的AIC的典型值是数千,至少数百。例如,在http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/上 ,AIC为727.39

虽然总是说AIC仅应用于比较模型,但我想了解特定AIC值的含义。根据公式, 一个一世C=-2日志大号+2ķ

其中,L =来自MLE估计器的最大似然,K是参数数量

在上面的示例中,K = 8

因此,用简单的算术:

727.9 = -2*log(L)+ 2*8
Hence, 711.39 = -2*log(L)
Hence, log (L)= 711.39/-2 = -355.695
Hence, L = exp(-355.695) = 3.3391E-155

因此,如果我的理解是正确的,这就是通过MLE拟合数据确定的功能的可能性。这似乎真的真的很低。

我在这里想念什么?


如果我们将其视为
pmf观察数据;参数估计
Björn15年

抱歉,如果我们这样看的话,它会被截断,这表明在大量记录中准确获取观察到的数据不太可能用于参数估计。
比约恩

Answers:


9

模型没有“典型”或正确的可能性。与AIC相同,即对许多参数不利的对数似然损失。较低的AIC值表示“更好”的模型,但这是模型拟合的相对度量。它用于模型选择,即,它使您可以比较在同一数据集上估计的不同模型。

回想一下GEP Box所说的 “所有模型都是错误的,但有些模型是有用的”,您不会对找到与数据完美契合的模型不感兴趣,因为这是不可能的,而且在许多情况下,这种模型将是非常差的,过度拟合的模型。相反,您正在寻找可以得到的最好的,最有用的一种。AIC背后的总体思路是,参数数量较少的模型更好,这在某种程度上与Occam的剃刀论点一致,即我们更喜欢简单模型而不是复杂模型。

您可以检查以下文件:

Anderson,D.,&Burnham,K.(2006年)。AIC的神话和误解。

Burnham,KP和Anderson,DR(2004)。多模型推断。了解模型选择中的AIC和BIC。 社会学方法与研究,33(2),261-304。

和那些线程:

“可能性”和“概率”之间有什么区别?

有没有理由比其他更喜欢AIC或BIC?



3

[R2χ2χ2-2×[R21个-经验值-χ2/ñ[R2[R2


3

这似乎真的真的很低。我在这里想念什么?

涉及使用对数似然性的数量(例如AIC)仅相对于其他此类数量有意义。请记住,似然函数只能定义为缩放常数,因此可以随意缩放。因此,对数似然仅定义为一个位置常数,并且可以随意上移或下移。对于AIC而言,这也适用,因为此数量仅是对数似然性,并且对参数数量进行了惩罚。这就是据说AIC仅应用于比较模型的原因。

ñ=800

^=727.9-2×8/-2=-355.95。

^/ñ=-0.44493750.6408643


0

您已经正确指出,如果使用R报告的AIC对可能性进行反算,则得出的可能性极低。原因是R报告的AIC值(称为AICrep)不是真正的AIC(AICtrue)。AICrep和AICtrue的区别在于一个常数,该常数取决于测量的数据,但与选择的模型无关。因此,从AICrep反算的可能性将是不正确的。这是差异在工商,当不同的模型来拟合相同的数据是在选择最佳模型有用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.