如何在AIC的基础上比较模型?


13

我们有两个模型使用相同的方法来计算对数似然,并且一个模型的AIC低于另一个模型。但是,AIC较低的人很难解释。

我们在确定是否值得介绍难度时遇到了麻烦,我们使用AIC中的百分比差异来进行判断。我们发现两个AIC之间的差异仅为0.7%,而更复杂的模型的AIC降低了0.7%。

  1. 两者之间的低百分比差异是避免使用AIC较低的模型的充分理由吗?

  2. 差异百分比是否说明在较简单的模型中丢失了0.7%的信息?

  3. 两种模型的结果能否完全不同?



2
@ArunJose,它似乎不是重复的。这里的问题完全不同。
理查德·哈迪

1
否。这个问题与模型的可比性无关。我们已经知道这些模型是可比的。这个问题与AIC的重大差异以及复杂性与模型拟合之间的权衡有关。
阿里·图拉布·洛蒂亚

Answers:


25

一个不比较两个的绝对值(可以类似于但也可以),但是要考虑它们的区别: 其中是第 AIC的AIC 第一个模型,而是所检查的模型集(即首选模型)中获得的最低AIC。经验法则(例如,在Burnham&Anderson 2004中概述)是:1001000000

Δi=AICiAICmin,
AICiiAICmin
  1. 如果,则对第个模型有实质性的支持(或者仅值得一提反对它的证据),并且很有可能认为它是适当的描述;Δi<2i
  2. 如果,则对第个模型有强大的支持;2<Δi<4i
  3. 如果,那么对第个模型的支持会大大减少;4<Δi<7i
  4. 模型基本上不支持。Δi>10

现在,关于问题中提到的0.7%,请考虑两种情况:

  1. AIC1=AICmin=100而大0.7%:。然后因此模型之间没有实质性差异。AIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000而则增大了0.7%:。然后因此不支持第二模型。AIC2AIC2=100700Δ2=70010

因此,说AIC之间的差异为0.7%并不能提供任何信息。

AIC值包含来自对数似然缩放常数 ,因此没有此类常数。可能会认为是一种重新缩放的转换,它迫使最佳模型具有。LΔiΔi=AICiAICminAICmin:=0

AIC的制定不利于使用过多的参数,因此不建议过度拟合。它偏爱参数较少的模型,只要其他模型不能提供更好的拟合度。AIC试图选择一个模型(在检查的模型中),最能描述现实(以检查数据的形式)。这意味着实际上从来没有考虑过模型是对数据的真实描述。请注意,AIC会为您提供信息,该信息可以更好地描述数据,该模型没有给出任何解释

就个人而言,我想说的是,如果您有一个简单模型,而一个复杂模型的AIC却低得多,那么简单模型就不够好。如果更复杂的模型确实复杂得多,但是并不庞大(也许,也许取决于特定情况),如果使用起来更简单,我会坚持使用更简单的模型。ΔiΔi<2Δi<5

此外,您可以通过以下方式将概率归因于第个模型i

pi=exp(Δi2),

这提供了第个模型使AIC最小化的相对(与)的概率。例如,对应于(相当高),对应于(相当低)。第一种情况意味着第个模型实际上可能比产生的模型更好的描述是47%的概率,而在第二种情况下,该概率仅为0.05%。AICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

最后,关于AIC的公式:

AIC=2k2L,

重要的是要注意,当考虑两个具有相似模型时,由于项,仅取决于参数的数量。因此,当,相对改善是由于拟合的实际改善,而不仅仅是增加参数的数量。LΔi2kΔi2Δk<1

TL; DR

  1. 这是一个不好的理由;使用AIC的绝对值之间的差。
  2. 百分比没有说明。
  3. 由于没有有关模型,数据以及不同结果的含义的信息,因此无法回答此问题。

1
这是我见过的关于这个神秘事物的最清晰的解释。我查阅了您引用的文章(第270-272页),这里的解释是对文章解释的简单,清晰但非常准确的表示。
Tripartio '18

您能否为这个后续问题提供帮助?stats.stackexchange.com/questions/349883/…–
Tripartio,
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.