测试两个非嵌套模型的AIC差异


12

AIC或任何其他信息标准的全部要点是,越少越好。因此,如果我有两个模型M1:y = a0 + XA + e和M2:y = b0 + ZB + u,并且如果第一个(A1)的AIC小于第二个(A2)的AIC,则M1具有从信息论的角度来看,这是一个更好的选择。但是,是否存在差异A1-A2的截止基准?少多少就是少多少?换句话说,除了眼球外,是否还有针对(A1-A2)的测试?

编辑:Peter / Dmitrij ...感谢您的答复。实际上,在这种情况下,我的实质专长与我的统计专长相冲突。从本质上讲,问题不是在两个模型之间进行选择,而是在检查两个我知道在很大程度上相等的变量是否添加了相等数量的信息(实际上,第一个模型中的一个变量和第二个模型中的向量。请考虑以下情况)一堆变量,而不是它们的索引。)正如Dmitrij指出的那样,最好的选择似乎是考克斯考验。但是,是否有一种方法可以实际测试两个模型的信息内容之间的差异?


您可能也有兴趣查看Wagonmakers等。(2004)。使用参数引导程序评估模型模仿度。数学心理学杂志,48,28-50。(pdf)。
gung-恢复莫妮卡

Answers:


13

是好奇心的问题,即您对我在这里的回答不满意吗?如果不...

这个棘手的问题的进一步研究表明,确实存在一个常用的原则进行的拇指,各国两款机型是无法区分的由标准,如果差 | A I C 1A I C 2 | < 2。您实际上会在Wikipedia的A I C文章中看到相同的内容(请注意,该链接是可单击的!)。仅针对那些不单击链接的人:AIC|AIC1AIC2|<2AIC

估计模型相对支持。为了将其实际应用,我们从一组候选模型开始,然后找到模型的相应 A I C值。接下来,确定最小的 A I C值。然后可以如下选择模型。AICAICAIC

作为一个粗略的规则,其型号的1 - 2最小的具有实质性的支持,并应进行推论得到考虑。具有他们的模型Ç内大约4 - 7的最小的具有相当少的支持,而与他们的模型ç > 10高于最小值要么基本上没有支撑和可能被从进一步的考虑或至少省略无法解释一些数据的实质性结构变化。AIC12AIC47AIC>10

一种更通用的方法如下...

A I C 1A I C 2 A I C 3 A I C R表示候选模型的值。令A I C m i n表示那些值的最小值。则e A I C m i n A I C i / 2AICAIC1AIC2,AIC3,,AICRAICmine(AICminAICi)/2可以将第个模型解释为第i个模型使(预期的估计)信息损失最小化的相对概率。i

作为一个例子,假设有三个模型在候选集合中,用100102,和110。然后第二个模型是ë 100 - 102 / 2 = 0.368倍可能作为第一模型以最小化信息损失,且第三模式是ë 100 - 110 / 2 = 0.007AIC100102110e(100102)/2=0.368e(100110)/2=0.007最大程度地减少了信息损失,是第一个模型的两倍。在这种情况下,我们可能会省略进一步考虑的第三个模型,而取前两个模型的加权平均值,分别为权重0.368。然后,统计推断将基于加权多模型。10.368

我认为很好的解释和有用的建议。只是不要害怕阅读可点击的内容!

此外,注意一次,是用于大规模数据集较少优选的。除了B I C以外,您可能会发现应用A I C标准A I C c的偏差校正版本也很有用(您可以使用此代码或使用公式A I C c = A I C + 2 p p + 1 AICBICAICAICcR ,其中p是估计参数的数量)。经验法则是相同的。 AICc=AIC+2p(p+1)np1p


嗨,Dmitrij ...我知道你会发现的。实际上,您对原始问题的回答使这列火车开始运转。我认为这将成为一个有趣的独立问题。我要解决的问题是统计测试(包括Cox's Test)经常使用,因此您可以在预定义的显着性水平下测试两个模型之间的差异。但是AIC / BIC是基于可能性的,而且在我看来,除非您凭经验指出,否则无法直接比较这些数字。由于IC度量取决于比例,所以绝对值(2)可能会成问题,不是吗?
user3671 2011-03-21

@user,绝对值没问题。您可能会提出相对概率建议,因此您可能会比2的一些不错的值更有信心。通过规模效应,你的意思是,当标准小样本中较少偏见和大型是否一致?尝试使用一致的B I C和小样本的A I C c也将是一个不错的选择。经验法则仍然可用。22BICAICc
Dmitrij Celov 2011年

1
@DmitrijCelov(前段时间为+1)是一个不错的答案-感谢您粘贴文本,因为Wikipedia不再包含前两段中的要点。删除的段落引用为p。446:Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7. 修订前的Wiki页面在这里
James Stanley

我应该注意,我还没有读过伯纳姆的书,而旧的Wiki参考资料表明引用的文字是一个措辞。仅供参考,Wiki页面的编辑时间为2011
James Stanley

您能否为这个后续问题提供帮助?stats.stackexchange.com/questions/349883/…–
Tripartio,

8

我认为这可能是尝试获得您真正不想要的东西。

模型选择不是一门科学。除非在极少数情况下,否则没有一种完美的模型,甚至没有一种“真实”的模型。甚至没有一种“最佳”模型。关于AIC,AICc,BIC,SBC和其他的讨论使我有些不解。我认为这个想法是要获得一些良好的模型。然后,您可以根据实质性专业知识和统计思想进行选择。如果您没有实质性的专业知识(罕见的情况;比大多数人想象的要少得多),则选择最低的AIC(或AICc或其他任何一种)。但是您通常确实有一些专业知识-否则为什么要调查这些特定变量?


2
+1是为了强调对统计和实质性专业知识的需求。
chl
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.