为什么在时间序列模型中使用信息标准(未调整的


9

在时间序列模型(例如ARMA-GARCH)中,为了选择模型的适当滞后或阶数,使用了不同的信息标准(例如AIC,BIC,SIC等)。

我的问题很简单,为什么不使用调整后的R2选择合适的模型?我们可以选择导致较高的值的模型R2。因为调整后的R2和信息准则都会对模型中更多数量的回归变量进行惩罚,因此前者惩罚R2而后者则惩罚似然值。


我可能在答案中缺少某些内容(以下),但R平方和调整后的R平方适用于相对有限的OLS估计模型类别,而AIC,BIC等则适用于广义线性模型的较广泛类别用ML或变体估算的模型。
Mike Hunter

Answers:


12

我认为至少在讨论线性模型(如AR模型)时,调整后的和AIC并没有太大区别。R2

考虑是否问题应包含在 Ŷ = X 1Ñ × ķ 1 β 1 + X 2Ñ × ķ 2 β 2 + ε 这等同于比较所述模型 中号 1X2

y=X1(n×K1)β1+X2(n×K2)β2+ϵ
其中Èû|X1X2=0。我们说,中号2真实模型,如果β20。注意,中号1中号2。因此模型是嵌套的。模型选择过程中号
M1:y=X1β1+uM2:y=X1β1+X2β2+u,
E(u|X1,X2)=0M2β20M1M2M^ 是一个与数据相关的规则,它从多个模型中选择最合理的一个。

M^

limnP(M^=M1|M1)=1limnP(M^=M2|M2)=1

考虑调整后的。也就是说,如果选择。由于在单调递减,因此此过程等效于最小化。反过来,这等效于最小化。对于足够大的,后者可以写为 其中中号 1 ˉ - [R 2 1 > ˉ - [R 2 2 ˉ - [R 2 小号2R2M1R¯12>R¯22R¯2s2 log s 2n log s 2s2log(s2)n

log(s2)=log(σ^2nnK)=log(σ^2)+log(1+KnK)log(σ^2)+KnKlog(σ^2)+Kn,
σ^2是误差方差的ML估计量。因此,基于的模型选择在渐近上等效于选择具有最小 。此过程不一致。R¯2log(σ^2)+K/n

命题

limnP(R¯12>R¯22|M1)<1

证明: ,这里的倒数第二行是因为在线性回归情况下,统计量是LR统计量,它遵循渐近空分布。优质教育

P(R¯12>R¯22|M1)P(log(s12)<log(s22)|M1)=P(nlog(s12)<nlog(s22)|M1)P(nlog(σ^12)+K1<nlog(σ^22)+K1+K2|M1)=P(n[log(σ^12)log(σ^22)]<K2|M1)P(χK22<K2)<1,
χK22

现在考虑Akaike的标准,即 因此,AIC还在权衡“惩罚性条款”和其他回归指标所隐含的SSR降低之间进行权衡”指向相反的方向。因此,如果 ,请选择,否则请选择。

AIC=log(σ^2)+2Kn
M1AIC1<AIC2M2

可以看出,通过将上述证明在第三行中继续使用,也不一致。因此,即使是真实模型,调整后的和正概率选择“大”模型。P Ñ 日志σ 2 1+ 2 ķ 1 < Ñ 日志σ 2 2+ 2 ķ 1 + ķ 2| 中号 1- [R 2ç 中号 2 中号 1AICP(nlog(σ^12)+2K1<nlog(σ^22)+2(K1+K2)|M1)R2AICM2M1

但是,由于AIC中复杂性的损失要比调整后的稍大,因此,它不太可能过分选择。而且它还有其他一些不错的属性(如果不在考虑的模型集中,则将KL差异最小化为真实模型)在我的帖子中未解决。R2


1
好答案:不太重,但仍然准确!如果昨天去过那儿,我不会张贴我的。
理查德·哈迪

对于ARMA-GARCH案例呢?在选择amung MA和GARCH术语时会如何做?Radj2
Zachary Blumenfeld

我不敢说。正如您所解释的那样,R2对于这种模型的适合性甚至还不清楚。
Christoph Hanck

5

中的损失在AIC或BIC提出的模型选择方面没有产生很好的性能。当没有回归变量实际上不属于模型时,的惩罚足以使成为总体的无偏估计量(根据Dave Giles的博客文章“在某种意义上说是“调整后的R平方无偏的?”“关于“调整后的”确定系数的性质的更多信息”)?但是,不是最佳模型选择器。Radj2Radj2Radj2R2Radj2

(可能有一个矛盾的证明:如果AIC在一种意义上是最优的,而BIC在另一种意义上是最优的,并且不等同于任何一个,那么都不是最优的两种感官中的一种。) R 2 a d jRadj2Radj2


在增加之前,我必须添加几个GARCH参数?:)....我相信可以为相关误差的假设做出类似的论点(就像在MA模型中一样),GLS模型不会减少普通最小二乘法的残差平方和。在MA和GARCH中,都将参数(不是为进行调整的解释性变量)添加到模型中。不添加MA和GARCH参数以减少,而是添加它们以增加可能性和/或减少平方残差的加权总和以反映缺乏iid误差项。R 2 a d j S S RR2R2adjSSR
Zachary Blumenfeld

这实际上是针对原始帖子还是我的答案?无论如何,我同意你的观点。
理查德·哈迪

我要指出的是,不能真正用于选择GARCH分量(也可能是MA分量),因为它基于对于的分数,这是有偏估计量错误项不是iid时的方差。(这只是您所谈论的偏见的一种具体情况)。对于ARMA-GARCH,即使数据存在随机波动,也永远不会选择具有GARCH组件的模型,因为它不会增加。基本上,我通过尝试举一些具体的例子来表示同意。 S S T - S S R S S T R 2Radj2SSTSSRSSTR2
Zachary Blumenfeld
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.