我了解,如果一个流程依赖于其自身先前的值,那么它就是一个AR流程。如果它取决于先前的错误,则它是一个MA进程。
这两种情况之一何时发生?有没有人有一个可靠的例子来阐明关于将流程最好地建模为MA vs AR意味着什么的根本问题?
我了解,如果一个流程依赖于其自身先前的值,那么它就是一个AR流程。如果它取决于先前的错误,则它是一个MA进程。
这两种情况之一何时发生?有没有人有一个可靠的例子来阐明关于将流程最好地建模为MA vs AR意味着什么的根本问题?
Answers:
一个重要且有用的结果是Wold表示定理(有时称为Wold分解),该定理表示每个协方差平稳时间序列可以写为两个时间序列之和,一个是确定性的,一个是随机的。
其中是确定性的。
第二项是无限MA。
(在这种情况下,可以将可逆MA写入为无限AR过程。)
这表明,如果序列是协方差平稳的,并且假设我们可以确定确定性部分,那么可以始终将随机部分写为MA过程。同样,如果MA满足可逆性条件,则始终可以将其编写为AR过程。
如果您以一种形式编写流程,则通常可以将其转换为另一种形式。
因此,至少在某种意义上,对于协方差平稳序列,AR或MA通常都是合适的。
当然,实际上,我们宁愿没有非常大的模型。如果您有一个有限的AR或MA,则ACF和PACF最终都会在几何上衰减(存在一个几何函数,每个函数的绝对值都将位于下面),这将倾向于表示AR或其他形式的MA可能通常很短。
因此,在协方差平稳条件下并假设我们可以确定确定性和随机性成分,AR和MA通常都适用。
Box和Jenkins方法论寻找一种简约模型-一种参数很少的AR,MA或ARMA模型。通常,ACF和PACF用于尝试识别模型,方法是转换为平稳性(也许通过区别),从ACF和PACF的外观识别模型(有时人们使用其他工具),拟合模型,然后检查模型。残差的结构(通常通过残差上的ACF和PACF),直到残差序列看起来与白噪声相当一致。通常会有多个模型可以为一个系列提供合理的近似值。(实际上,通常会考虑其他标准。)
有一些批评这种方法的理由。例如,这种迭代过程产生的p值通常不会考虑模型的生成方式(通过查看数据);例如,可以通过样本拆分至少部分避免此问题。第二个批评例子是实际上很难获得平稳的序列-尽管在许多情况下可能会转化为获得看起来与平稳性合理一致的序列,但通常情况并非如此(实际上类似的问题很常见)统计模型的问题,尽管有时可能在这里更成问题)。
[一个AR和对应的无限MA之间的关系在海德门和Athanasopoulos'讨论预测:原理和实践, 这里 ]
我可以提供我认为对问题第一部分(“ whence MA?”)有说服力的答案,但目前正在思考对问题第二部分(“ whence AR?”)的同样令人信服的答案。
考虑一个由连续两天的股票收盘价(针对拆分和股利调整)组成的系列。每天的收盘价是从趋势(例如时间线性)加上前几天每日震荡的加权影响得出的。大概,第t-1天的震荡影响将比第t-2天的震荡对t天的价格产生更大的影响,依此类推。因此,从逻辑上讲,股票在t天的收盘价将反映趋势第t天的值加上一个常数(小于1)乘以直到t-1天为止的冲击的加权总和(即,第t-1天的误差项)(MA1),可能加上一个常数(小于1)乘以直到t-2天为止的电击的加权总和(即,t-2天的误差项)(MA2),...,加上t天的新型电击(白噪声)。这种模型似乎适合于对股市等系列进行建模,其中第t天的误差项代表先前和当前冲击的加权总和,并定义了MA流程。我正在为完全AR流程提供同样令人信服的理由。
这是我想出的最简单的示例,可帮助可视化AR,MA和ARMA流程。
请注意,这只是介绍主题的视觉辅助手段,并不足以解决所有可能的情况。
假设以下内容:我们在比赛中有两个特工,负责执行某种动作(水平向右跳)。
平均而言,根据其身体能力,每次跳跃平均预期“人类”将覆盖“μ”的距离且标准偏差为“ 𝛿”。但是,人类尤其缺乏精神毅力:),他/她的表现还取决于先前的跳跃是否落后/达到/超过了他/她的期望。
“机器”的设计规格与上述人员完全相同,只有一个区别–机器无动于衷,不受以往性能的影响。
此外,两个特工都将玩两场比赛,每场比赛涉及两次跳跃:
“最终跳高”是根据热身跳高后最后一次跳高的距离得分的,该结果在比赛中被忽略,但可供人类观察。最后的跳转从预热跳转开始的地方开始。
“联合跳跃”是根据初始和最终跳跃所涵盖的组合距离得分的。最后的跳跃从初始跳跃着陆的地方开始。
下图显示了哪种模型最能描述与上述演员和游戏相关的四个场景。
因此,您有一个单变量时间序列,并且想要对其进行建模/预测,对吧?您已选择使用ARIMA类型模型。
参数取决于最适合您的数据集的参数。但是你怎么发现的呢?一种最新的方法是Hyndman&Khandakar(2008)(pdf)的“自动时间序列预测” 。
该算法尝试使用p,q,P和Q的不同版本,并选择AIC,AICc或BIC最小的版本。它是在Forecast R包的auto.arima()函数中实现的。信息标准的选择取决于传递给函数的参数。
对于线性模型,选择具有最小AIC的模型等效于留一法交叉验证。
您还应该确保至少有四年的数据量。
一些重要的检查:
明确回答以下Firebug的评论:数据支持时。
"My question is, when would one of either of these two situations occur? "