我们有两个模型使用相同的方法来计算对数似然,并且一个模型的AIC低于另一个模型。但是,AIC较低的人很难解释。
我们在确定是否值得介绍难度时遇到了麻烦,我们使用AIC中的百分比差异来进行判断。我们发现两个AIC之间的差异仅为0.7%,而更复杂的模型的AIC降低了0.7%。
两者之间的低百分比差异是避免使用AIC较低的模型的充分理由吗?
差异百分比是否说明在较简单的模型中丢失了0.7%的信息?
两种模型的结果能否完全不同?
我们有两个模型使用相同的方法来计算对数似然,并且一个模型的AIC低于另一个模型。但是,AIC较低的人很难解释。
我们在确定是否值得介绍难度时遇到了麻烦,我们使用AIC中的百分比差异来进行判断。我们发现两个AIC之间的差异仅为0.7%,而更复杂的模型的AIC降低了0.7%。
两者之间的低百分比差异是避免使用AIC较低的模型的充分理由吗?
差异百分比是否说明在较简单的模型中丢失了0.7%的信息?
两种模型的结果能否完全不同?
Answers:
一个不比较两个的绝对值(可以类似于但也可以),但是要考虑它们的区别: 其中是第 AIC的AIC 第一个模型,而是所检查的模型集(即首选模型)中获得的最低AIC。经验法则(例如,在Burnham&Anderson 2004中概述)是:
现在,关于问题中提到的0.7%,请考虑两种情况:
因此,说AIC之间的差异为0.7%并不能提供任何信息。
AIC值包含来自对数似然缩放常数 ,因此没有此类常数。可能会认为是一种重新缩放的转换,它迫使最佳模型具有。
AIC的制定不利于使用过多的参数,因此不建议过度拟合。它偏爱参数较少的模型,只要其他模型不能提供更好的拟合度。AIC试图选择一个模型(在检查的模型中),最能描述现实(以检查数据的形式)。这意味着实际上从来没有考虑过模型是对数据的真实描述。请注意,AIC会为您提供信息,该信息可以更好地描述数据,该模型没有给出任何解释。
就个人而言,我想说的是,如果您有一个简单模型,而一个复杂模型的AIC却低得多,那么简单模型就不够好。如果更复杂的模型确实要复杂得多,但是并不庞大(也许,也许取决于特定情况),如果使用起来更简单,我会坚持使用更简单的模型。
此外,您可以通过以下方式将概率归因于第个模型
这提供了第个模型使AIC最小化的相对(与)的概率。例如,对应于(相当高),对应于(相当低)。第一种情况意味着第个模型实际上可能比产生的模型更好的描述是47%的概率,而在第二种情况下,该概率仅为0.05%。
最后,关于AIC的公式:
重要的是要注意,当考虑两个具有相似模型时,由于项,仅取决于参数的数量。因此,当,相对改善是由于拟合的实际改善,而不仅仅是增加参数的数量。
TL; DR