如何直观地理解SARIMAX?


26

我正在尝试阅读有关电力负荷预测的论文,但我在内部概念(特别是SARIMAX模型)中苦苦挣扎。该模型用于预测负载,并使用许多我不了解的统计概念(我是本科计算机科学专业的学生,​​您可以认为我是统计学的外行)。我没有必要完全了解它是如何工作的,但是我至少想直观地了解正在发生的事情。

我一直在尝试将SARIMAX分成较小的部分,并试图分别理解每个部分,然后将它们组合在一起。你们能帮我吗?到目前为止,这就是我所拥有的。

我从AR和MA开始。

AR自回归。我已经了解了回归是什么,并且据我所知,它只是回答了这个问题:给定一组值/点,如何找到一个解释这些值的模型?因此,例如,我们有线性回归,它试图找到一条可以解释所有这些点的线。自回归是一种试图使用先前的值解释值的回归。

MA移动平均线。我实际上在这里很迷路。我知道什么是移动平均线,但是移动平均线模型似乎与“正常”移动平均线没有任何关系。该模型的公式似乎与AR很尴尬,我似乎无法理解我在互联网上找到的任何概念。MA的目的是什么?MA和AR有什么区别?

所以现在有了ARMA。然后,来自Integrated,据我所知,它仅是为了使ARMA模型具有增加或减少的趋势。(这是否等于说ARIMA允许它是非平稳的?)

现在是来自季节性S,这增加了ARIMA的周期性,例如,在负载预测的情况下,该参数基本上表示每天6 PM的负载看起来非常相似。

最后,来自外生变量的X基本上允许在模型中考虑外部变量,例如天气预报。

所以我们终于有了SARIMAX!我的解释可以吗?认识到这些解释并不需要严格正确。有人可以直观地解释我的意思吗?


6
您的直觉认为移动平均模型似乎与“正常”移动平均没有任何关系。例如,请参见:为什么将MA(q)时间序列模型称为“移动平均值”?
Graeme Walsh

Answers:


15

如您所述,(1)AR模型将时间处观察值的值与先前值相关联,但有一些错误: 让我们用代替,然后: 将其带到无穷大: 您可以将任何(固定)AR()编写为MA(xt

xt=ϕxt1+εt
xt1xt2
xt=ϕ(ϕxt2+εt1)+εt=ϕ2xt2+ϕεt1+εt=ϕ3xt3+ϕ2εt2+ϕεt1+εt
xt=ϕnxtn+ϕn1εtn+1+...+ϕεt1+εt
p),尽管您当然会遇到大量术语堆积。p>1

看到了这一点之后,我们现在重新定义一下定义(1)。一个AR过程将在时间处观测值的值与来自先前时间段的无限数量的衰减误差冲击(我们没有直接观测到)。xt ε

因此,现在可以更清楚地了解MA流程。(2)MA()过程涉及的观察值在时间到刚刚误差冲击从前期(我们不直接观察),其中系数被允许变化多指数衰减隐在AR模型中。如您所述,它与通常的“移动平均值”概念无关。X qqxtq

在MA()进程的系数上有一些条件的情况下,我们实际上可以执行与上述AR过程所示的非常相似的操作,即将MA()写为AR ()。因此,重新陈述(2)表示MA过程将时间处的观测值与所有先前值的衰减序列相关联,同样有效。 q q X Xθ1...θqqqxtx

因此,ARMA模型只是结合了这两种思想,将与无限衰减序列和已定义序列相关联。正如您指出的,ARIMA只是增加了差异,也就是说,您在(或可能存在的其他差异)上运行ARMA ,以消除趋势。x tx t 1xtxtxt1


您好Affine,感谢您的快速回复!我可以说MA就像是错误的AR吗?
2013年

有点。关键思想是可以将AR转换为无限长的衰减MA,反之亦然。因此,您分配给一个的任何直观含义-AR =将当前观察与先前观察相关联-可以分配给另一个-MA =将当前观察与所有先前的观察相关。或者像我最初在答案中找到它一样-AR =将当前观察结果与所有先前的错误“冲击”相关联,MA =将当前观察结果与先前的误差“冲击”相关联。qpq
Affine
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.