ARIMA模型的正则化


15

我知道线性回归模型中的LASSO,山脊和弹性网正则化类型。

题:

  1. 可以将这种(或类似的)惩罚估计应用于ARIMA建模(具有非空MA部分)吗?

pmaxqmax q q 一个Xppmaxqqmax

我的其他问题是:

  1. 我们是否可以包括(,)之前的所有项,但是会惩罚系数的大小(可能一直到零)?那有道理吗? q 中号一个XpmaxqmaX
  2. 如果可以,是否已在R或其他软件中实现?如果没有,那是什么麻烦?

一些相关的帖子可以在这里找到。


1
+1是一个很好的问题。由于P,Q是离散值,因此进行网格搜索以找到P,Q的最佳顺序可能更有效。
天气预报员

2
我很高兴你喜欢它!是的,网格搜索是框架中的选项之一,我称之为“通常的”。还有一个可能的可能组合的网格搜索超过0 0 p 一个Xq 一个X。但是,这仍然是“常规框架”的一部分。另外,我有兴趣保留所有滞后,但要惩罚系数的大小。pq00p一种Xq一种X
理查德·哈迪

1
columbia.edu/~sn2294/papers/forecast.pdf 据说LASSO的效果更好,因为您可以跳过一些滞后而不是进行最大滞后。AIC可以做同样的事情,但是它在计算上变得昂贵。
Cagdas Ozgenc 2015年

1
@CagdasOzgenc,我略读了这篇论文,但它似乎没有处理应用于ARIMA模型的正则化(尽管在信息标准的上下文中提到了ARMA模型)。您能否指出本文的哪一部分与我的问题有关?
理查德·哈迪

1
5.3该表包含ARMAX模型。结果适用于ARMA模型。
Cagdas Ozgenc

Answers:


9

回答问题1。

Chen&Chan的“通过自适应套索进行子集ARMA选择”(2011年)*使用了一种变通方法来避免计算上要求最大的似然估计。他们引用这篇论文

建议通过将时间序列的自适应Lasso回归与其自身的滞后以及通过对y t s 拟合长的自回归获得的残差的自适应Lasso回归来找到最优子集ARMA模型。[...]在温和的规律性条件下,所提出的方法获得了预言性,即,当样本量增加到无穷大时,它会识别概率趋于于1的正确的子集ARMA模型,并且...非零系数的估计量是渐近正态的,其极限分布与先验已知零系数的情况相同。ÿŤÿŤ

可选地,他们建议针对所选的子集ARMA模型进行最大似然估计和模型诊断。


Wilms等。“高维矢量自回归移动平均的稀疏识别和估计”(2017年)的作用甚至超出了我的要求。他们采用高维向量ARMA(VARMA)代替了单变量ARIMA模型,并且使用罚分进行估计和滞后顺序选择。他们提出了估计算法并得出了一些渐近结果。大号1

特别是,他们采用两阶段程序。考虑一个VARMA模型 需要被估计,但滞后阶数pq是UKNOWN。

ÿŤ==1pΦÿŤ-+=1qΘεŤ-+εŤ
pq
  • 在阶段1中,他们通过高阶VAR模型近似VARMA模型,并使用Hierarchical VAR估计器对其进行估计,该估计器将基于滞后的分层group-lasso惩罚置于自回归参数上。
    (滞后顺序被设定为。共同估计模型方程和误差的Frobenius范数| | ÿ - ÿ | | ˚F 2被最小化与该回归系数的分级组套索罚分)。 他们获得残差 ε=ÿ - ÿ被用作代理以便在第2阶段的真实误差。1.5Ť||ÿ-ÿ^||2F
    ε^:=ÿ-ÿ^

  • 在第2阶段,他们估计VARx前提模型,其中X代表滞后来自阶段1。即残差,它们MINIC一个VARMA模型,但代替真实的错误,使用估计残差这允许将相同的估计器(分级组套索)再次就像在阶段1 (pq

    ÿŤ==1p^ΦÿŤ-+=1q^Θε^Ť-+üŤ

    p^q^被设定为。)1.5Ť

Wilms等人的方法。是在R封装中实现“BIGTIME”


参考文献


*感谢@hejseb提供的链接。


2
该工作文件非常新鲜,昨天刚刚发布在arXiv上。
理查德·哈迪

python或R中有任何实现吗?
David Masip '18

@DavidMasip,请参阅更新后的文章以获取R实现。
理查德·哈迪
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.