移动平均模型误差项


17

这是Box-Jenkins MA模型的基本问题。据我了解,MA模型基本上是时间序列值对先前误差项的线性回归。也就是说,观测值首先针对其先前值回归,然后将一个或多个值用作MA的误差项模型。Yet,...,etnYYt1,...,YtnYY^

但是,如何在ARIMA(0,0,2)模型中计算误差项?如果使用MA模型时没有自回归部分,因此没有估计值,那么我怎么可能有一个误差项?


1
不,我认为您对MA(n)模型的定义感到困惑,在该模型中,回归仅根据进行估计,而是根据数据进行估计。etieti
西安

1
问题中的主要问题是您说MA模型基本上是线性回归。这是完全不正确的,因为我们没有遵守错误条件。
mpiktas 2012年

我认为误差项实际,其中YtYt^Y^E(Y|Yt,...,tn)或者干脆YtYt1。这就是为什么从Y偏自相关函数中的重复模式(即残差的行为)得出MA模型参数估计的原因。相反,AR参数估计是基于acf(Y)的重复模式。
罗伯特·库布里克

Answers:


20

MA模型估计:

让我们假设一个具有100个时间点的序列,并说它的特征在于没有截距的MA(1)模型。然后该模型由

yt=εtθεt1,t=1,2,,100(1)

没有观察到错误项。为此,Box等人。时间序列分析:预测和控制(第3版)第228页,建议误差项通过以下方式递归计算:

εt=yt+θεt1

因此,对于误差项是, ε 1 = ý 1 + θ ε 0 现在我们不能在不知道的值计算该θ。因此,要获得此结果,我们需要计算模型的初始或初步估计,请参考Box等。在上述书籍的第6.3.2节第202页中指出,t=1

ε1=y1+θε0
θ

已经示出了第一 MA(的自相关q)过程是非零的,并且可以在模型中作为的参数方面写入 ρ ķ = - θ ķ + θ 1 θ ķ + 1 + θ 2 θ ķ + 2 + + θ q - ķ θ qqq上述用于表达 ρ 1ρ 2ρ q 而言 θ 1θ 2θ q,用品 q等式 q未知数。的初步估计 θ S可通过替代估计来获得 ř ķ ρ ķ在上述方程

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρqθ1,θ2,,θqqqθrkρk

注意,是估计的自相关。第6.3节-参数的初始估计中有更多讨论,请继续阅读。现在,假设我们获得初始估计值θ = 0.5。然后, ε 1 = ý 1 + 0.5 ε 0 现在,另一个问题是,我们没有值ε 0,因为开始于1,所以我们不能计算ε 1。幸运的是,有两种方法可以得到这个,rkθ=0.5

ε1=y1+0.5ε0
ε0tε1
  1. 有条件的可能性
  2. 无条件可能性

根据Box等。第7.1.3节227页,的值可以被取代以零作为近似如果Ñ适中或大的,该方法是有条件的似然。否则,无条件似然被使用,其中,所述值ε 0是由背预测,盒等获得。推荐这种方法。在第231页的7.1.4节中了解有关反向预测的更多信息。ε0nε0

获得初始估计和的值之后,然后终于可以与误差项的递归计算继续。然后最后阶段是估计模型的参数1 ,请记住这不再是初步估计。ε0(1)

在估计参数,我使用了非线性估计程序,尤其是Levenberg-Marquardt算法,因为MA模型的参数是非线性的。θ

总体而言,我强烈建议您阅读Box等。时间序列分析:预测和控制(第3版)


你能解释什么是吗?rk
Piyush Divyanakar '18

4

高斯MA(q)模型定义(不仅由方块和詹金斯!)作为 这样的MA(q)模型是“纯”的错误模型,该程度 q定义多远的相关性返回。

Yt=i=1qϑieti+σet,etiidN(0,1)
q

1
我仍然不明确地方得来的。是Ë 牛逼的随机变量?我不这么认为,否则为什么要麻烦寻找q相关性呢?etetq
罗伯特·库布里克

1
为什么您的公式中有减号?通常减号适用于AR模型。数学上不是问题,我只是好奇,因为我从未见过MA模型的缺点。
mpiktas 2012年

3
@RobertKubrick,您知道沃尔德分解定理吗?每一个平稳过程都有其相应的创新过程,也就是从那里方面来。et
mpiktas 2012年

1
@mpiktas谢谢,这为错误术语提供了一些背景知识,但是我仍然不清楚创新过程来自何处,要想存在一项创新,就必须在某个地方进行预测(en.wikipedia.org/wiki/Innovation_( signal_processing))。最优预测是否只是E Y ,即序列的均值?YE(Y)
罗伯特·库布里克

1

YYt1,...,YtnYY^Yet1et2etθ1et1θ2et2etθ1θ2θ1θ2


另外2个预测变量系列是什么?我之所以问是因为,当我阅读文献时,从来没有明确指出。这2个其他系列与ÿ?我的印象是,所有ARIMA配方都限于ÿ 系列。
Robert Kubrick

1
The 2 predictors are the lags of the error terms. Since these are not known a priori since we do not know the error terms before we begin is why this has to be treated by non-linear estimation.The confusion you are having is that a model that is finite in the past ( i.e. an AR MODEL ) is potentially infinite in the errors AND a model that is finite in the errors ( i.e. an MA MODEL) is potentially infinite in the past of Y.The reason one selects an AR MODEL versus an MA MODEL is for parsimony. Sometimes we construct an ARMA MODEL which blends both the history of Y and the history of the errors.
IrishStat

1
As I commented in the other answer, what I am still missing is what's the optimal forecast for Y, which is used to calculate the innovation etn.
Robert Kubrick

1

有关如何理解MA系列中的干扰项的说明,请参见此处的我的帖子。

您需要不同的估算技术来估算它们。这是因为您不能先获取线性回归的残差,然后再将滞后的残差值用作解释变量,因为MA流程会使用当前回归的残差。在您的示例中,您正在制作两个回归方程,并使用一个残差到另一个残差。这不是MA流程。无法使用OLS进行估算。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.