MA流程或AR流程在什么情况下合适?


21

我了解,如果一个流程依赖于其自身先前的值,那么它就是一个AR流程。如果它取决于先前的错误,则它是一个MA进程。

这两种情况之一何时发生?有没有人有一个可靠的例子来阐明关于将流程最好地建模为MA vs AR意味着什么的根本问题?


3
这不是那么简单的二分法。毕竟,AR可以写成无限的MA,而(可逆的)MA可以写成无限的AR,因此,如果任何一个合适,那么另一个也可以。
Glen_b-恢复莫妮卡2014年

1
Glen_b,您能详细说明一下吗?我知道这不是一个简单的二分法...我是否正确地假设(甚至希望)在这里发现一些值得关注的东西?我不想简单地运行acf / pacf并假装我对此过程有很好的了解。
Matt O'Brien 2014年

Answers:


10

一个重要且有用的结果是Wold表示定理(有时称为Wold分解),该定理表示每个协方差平稳时间序列ÿŤ可以写为两个时间序列之和,一个是确定性的,一个是随机的。

ÿŤ=μŤ+Ĵ=0bĴεŤ-Ĵ其中μŤ是确定性的。

第二项是无限MA。

(在这种情况下,可以将可逆MA写入为无限AR过程。)

这表明,如果序列是协方差平稳的,并且假设我们可以确定确定性部分,那么可以始终将随机部分写为MA过程。同样,如果MA满足可逆性条件,则始终可以将其编写为AR过程。

如果您以一种形式编写流程,则通常可以将其转换为另一种形式。

因此,至少在某种意义上,对于协方差平稳序列,AR或MA通常都是合适的。

当然,实际上,我们宁愿没有非常大的模型。如果您有一个有限的AR或MA,则ACF和PACF最终都会在几何上衰减(存在一个几何函数,每个函数的绝对值都将位于下面),这将倾向于表示AR或其他形式的MA可能通常很短。

因此,在协方差平稳条件下并假设我们可以确定确定性和随机性成分,AR和MA通常都适用。

Box和Jenkins方法论寻找一种简约模型-一种参数很少的AR,MA或ARMA模型。通常,ACF和PACF用于尝试识别模型,方法是转换为平稳性(也许通过区别),从ACF和PACF的外观识别模型(有时人们使用其他工具),拟合模型,然后检查模型。残差的结构(通常通过残差上的ACF和PACF),直到残差序列看起来与白噪声相当一致。通常会有多个模型可以为一个系列提供合理的近似值。(实际上,通常会考虑其他标准。)

有一些批评这种方法的理由。例如,这种迭代过程产生的p值通常不会考虑模型的生成方式(通过查看数据);例如,可以通过样本拆分至少部分避免此问题。第二个批评例子是实际上很难获得平稳的序列-尽管在许多情况下可能会转化为获得看起来与平稳性合理一致的序列,但通常情况并非如此(实际上类似的问题很常见)统计模型的问题,尽管有时可能在这里更成问题)。

[一个AR和对应的无限MA之间的关系在海德门和Athanasopoulos'讨论预测:原理和实践这里 ]


1
-1是因为它虽然很有趣,但并不能真正回答问题的实质。
杰克·韦斯特伦

嗨,杰克(Jake)-感谢您添加关于您认为答案有误的评论。这比仅凭票就更有用。我同意这里缺少一些东西-至少应该弄清楚为什么我认为这足够相关才能发布答案。
Glen_b-恢复莫妮卡

1
@jake我进行了一些编辑,希望可以使与问题的联系更加清楚。再次感谢您的帮助
Glen_b-恢复莫妮卡

感谢您的修改。我删除了我的选票。我对修改后的答案的一句话总结是:“通常来说,这是一个很难回答的问题,因为在很多情况下,AR模型或MA模型都可以同时拟合数据。 ” 如果令人失望,这是对问题的合理回答。
杰克·韦斯特伦

@Jake认为如果您还有保留,就不需要删除票证;我很高兴有机会以任何一种方式改善答案。
Glen_b-恢复莫妮卡

5

我可以提供我认为对问题第一部分(“ whence MA?”)有说服力的答案,但目前正在思考对问题第二部分(“ whence AR?”)的同样令人信服的答案。

考虑一个由连续两天的股票收盘价(针对拆分和股利调整)组成的系列。每天的收盘价是从趋势(例如时间线性)加上前几天每日震荡的加权影响得出的。大概,第t-1天的震荡影响将比第t-2天的震荡对t天的价格产生更大的影响,依此类推。因此,从逻辑上讲,股票在t天的收盘价将反映趋势第t天的值加上一个常数(小于1)乘以直到t-1天为止的冲击的加权总和(即,第t-1天的误差项)(MA1),可能加上一个常数(小于1)乘以直到t-2天为止的电击的加权总和(即,t-2天的误差项)(MA2),...,加上t天的新型电击(白噪声)。这种模型似乎适合于对股市等系列进行建模,其中第t天的误差项代表先前和当前冲击的加权总和,并定义了MA流程。我正在为完全AR流程提供同样令人信服的理由。


3
+1。到目前为止,这是甚至试图回答原始问题的唯一答案。
S. Kolassa-恢复莫妮卡

如果我理解正确的话,听起来好像AR过程更适合于纠正重复出现的趋势,而MA则适合于纠正较大的,非重复发生的冲击。
Mike Campbell

0

这是我想出的最简单的示例,可帮助可视化AR,MA和ARMA流程。

请注意,这只是介绍主题的视觉辅助手段,并不足以解决所有可能的情况。

假设以下内容:我们在比赛中有两个特工,负责执行某种动作(水平向右跳)。

  1. 平均而言,根据其身体能力,每次跳跃平均预期“人类”将覆盖“μ”的距离且标准偏差为“ 𝛿”。但是,人类尤其缺乏精神毅力:),他/她的表现还取决于先前的跳跃是否落后/达到/超过了他/她的期望。

  2. “机器”的设计规格与上述人员完全相同,只有一个区别–机器无动于衷,不受以往性能的影响。

此外,两个特工都将玩两场比赛,每场比赛涉及两次跳跃:

  1. “最终跳高”是根据热身跳高后最后一次跳高的距离得分的,该结果在比赛中被忽略,但可供人类观察。最后的跳转从预热跳转开始的地方开始。

  2. “联合跳跃”是根据初始和最终跳跃所涵盖的组合距离得分的。最后的跳跃从初始跳跃着陆的地方开始。

下图显示了哪种模型最能描述与上述演员和游戏相关的四个场景。

该图描述了AR,MA和ARMA流程之间的差异


该海报需要一些解释和上下文才能理解。您能在回答中提供吗?
Whuber

-1

因此,您有一个单变量时间序列,并且想要对其进行建模/预测,对吧?您已选择使用ARIMA类型模型。

参数取决于最适合您的数据集的参数。但是你怎么发现的呢?一种最新的方法是Hyndman&Khandakar(2008)(pdf)的“自动时间序列预测” 。

该算法尝试使用p,q,P和Q的不同版本,并选择AIC,AICc或BIC最小的版本。它是在Forecast R包的auto.arima()函数中实现的。信息标准的选择取决于传递给函数的参数。

对于线性模型,选择具有最小AIC的模型等效于留一法交叉验证。

您还应该确保至少有四年的数据量。

一些重要的检查:

  1. 该模型有意义吗?例如,如果您有每月零售额,则可能会希望使用季节性模型。
  2. 样本外的预测效果如何?

明确回答以下Firebug的评论:数据支持时。


3
这个答案根本无法回答问题:"My question is, when would one of either of these two situations occur? "
Firebug

1
“以下对Firebug评论的明确答案:何时数据支持。” 我同意@Firebug-这不是问题的答案,而且绝对不是区分两者的可靠例子...
Thomas

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.