我认为至少在讨论线性模型(如AR模型)时,调整后的和AIC并没有太大区别。[R2
考虑是否问题应包含在
Ŷ = X 1(Ñ × ķ 1) β 1 + X 2(Ñ × ķ 2) β 2 + ε
这等同于比较所述模型
中号 1X2
ÿ= X1个(n × K1个)β1个+ X2(n × K2)β2+ ϵ
其中
È(û|X1,X2)=0。我们说,
中号2是
真实模型,如果
β2≠0。注意,
中号1⊂中号2。因此模型是
嵌套的。模型选择过程
中号中号1个中号2::ÿ= X1个β1个+ 你ÿ= X1个β1个+ X2β2+ ü ,
Ë(u | X1个,X2)= 0中号2β2≠ 0中号1个⊂ 中号2中号ˆ 是一个与数据相关的规则,它从多个模型中选择最合理的一个。
中号ˆ
林n → ∞P(Mˆ= M1个| 中号1个)林n → ∞P(Mˆ= M2| 中号2)==1个1个
考虑调整后的。也就是说,如果选择。由于在单调递减,因此此过程等效于最小化。反过来,这等效于最小化。对于足够大的,后者可以写为
其中中号 1 ˉ - [R 2 1 > ˉ - [R 2 2 ˉ - [R 2 小号2[R2中号1个[R¯21个> R¯22[R¯2s2 log (s 2)n log (s 2)s2log(s2)n
log(s2)==≈≈log(σˆ2nn−K)log(σˆ2)+log(1+Kn−K)log(σˆ2)+Kn−Klog(σˆ2)+Kn,
σˆ2是误差方差的ML估计量。因此,基于的模型选择在渐近上等效于选择具有最小
。此过程不一致。
R¯2log(σˆ2)+K/n
命题:
limn→∞P(R¯21>R¯22|M1)<1
证明:
,这里的倒数第二行是因为在线性回归情况下,统计量是LR统计量,它遵循渐近空分布。优质教育
P(R¯21>R¯22|M1)≈=≈=→<P(log(s21)<log(s22)|M1)P(nlog(s21)<nlog(s22)|M1)P(nlog(σˆ21)+K1<nlog(σˆ22)+K1+K2|M1)P(n[log(σˆ21)−log(σˆ22)]<K2|M1)P(χ2K2<K2)1,
χ2K2
现在考虑Akaike的标准,即
因此,AIC还在权衡“惩罚性条款”和其他回归指标所隐含的SSR降低之间进行权衡”指向相反的方向。因此,如果
,请选择,否则请选择。
AIC=log(σˆ2)+2Kn
M1AIC1<AIC2M2
可以看出,通过将上述证明在第三行中继续使用,也不一致。因此,即使是真实模型,调整后的和正概率选择“大”模型。P (Ñ 日志(σ 2 1)+ 2 ķ 1 < Ñ 日志(σ 2 2)+ 2 (ķ 1 + ķ 2)| 中号 1)- [R 2甲我ç 中号 2 中号 1AICP(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1)R2AICM2M1
但是,由于AIC中复杂性的损失要比调整后的稍大,因此,它不太可能过分选择。而且它还有其他一些不错的属性(如果不在考虑的模型集中,则将KL差异最小化为真实模型)在我的帖子中未解决。R2