寻求某种类型的ARIMA解释


25

这可能很难找到,但是我想阅读一个很好解释的ARIMA示例

  • 使用最少的数学

  • 将讨论从构建模型扩展到使用该模型预测特定案例

  • 使用图形和数值结果来表征预测值和实际值之间的拟合度。

Answers:


7

我建议阅读有关ARIMA建模入门的文章是

麦克莱里(R McCleary)1980年社会科学的应用时间序列分析 ; RA Hay; EE Meidinger; 麦克多沃尔

这是针对社会科学家的,因此数学要求不是太严格。此外,对于较短的治疗方法,我建议使用两本Sage Green书籍(尽管它们与McCleary的书籍完全多余),

Ostrom文字仅是ARMA建模,不讨论预测。我认为它们也不会满足您绘制预测误差图的要求。我相信您也可以通过在该论坛上检查带有时间序列标记的问题来挖掘更多有用的资源。


McCleary的书写得很出色,简洁且引人入胜。在上一章中,他们还谈论了Fortran之类的高级语言,其中还包含一些奇妙的无意幽默。
richiemorrisroe 2012年

31

我将尝试和回应whuber的温和敦促,使其简单地“回答问题”并继续关注话题。我们每月收到144份有关“航空系列”系列的阅读资料。Box和Jenkins由于提供了一个预测,该预测由于反向测井转换的“爆炸性”而异常偏高,因此受到广泛批评。在此处输入图片说明

在视觉上,我们得到的印象是,原始序列的方差随序列水平的增加而增加,表明需要进行转换。但是,我们知道有用模型的要求之一是“模型误差”的方差必须是均匀的。无需假设原始序列的方差。如果模型只是一个常数,即y(t)= u,则它们是相同的。正如/stats//users/2392/probabilityislogic在回应Advice关于解释异质性/异方差的建议时所说的那样明确 “我经常发现有趣的一件事是人们担心的这种“数据非正常性”关于。数据不需要正态分布,但错误项可以做到”

时间序列中的早期工作通常会错误地得出关于无端转换的结论。我们将在这里发现,此数据的补救性转换是将三个指标虚拟序列简单地添加到ARIMA模型中,以反映对三个异常数据点的调整。以下是自相关函数的图,表明滞后12(.76)和滞后1(.948)有很强的自相关。自相关只是模型中的回归系数,其中y是因y的延迟而预测的因变量。

在此处输入图片说明在此处输入图片说明

上面的分析表明,一个模型可以模拟序列的第一个差异,并研究“残差序列”,其性质与第一个差异首先相同。 在此处输入图片说明

这项分析再次证实了这样一个观点,即数据中存在一个很强的季节性模式,可以通过包含两个差分算子的模型对其进行补救或建模。

在此处输入图片说明 在此处输入图片说明

这种简单的双微分产生了一组残差(又称调整序列)或粗略地说是变换序列,证明了非恒定方差,但非恒定方差的原因是残差的非恒定均值。双倍差序列,表明该序列末尾有三个异常。该系列的自相关错误地表明“一切都很好”,可能需要进行任何Ma(1)调整。应注意数据中存在异常提示,因此acf会向下偏移。这就是所谓的“爱丽丝梦游仙境效应”,即当违反某种假设而掩盖了没有明显结构的原假设时,即接受该假设。

在此处输入图片说明 在此处输入图片说明

我们在视觉上检测到三个异常点(117,135,136)

在此处输入图片说明

检测异常值的这一步骤称为“干预检测”,可以按照以下Tsay的工作轻松地或不那么容易地进行编程。

在此处输入图片说明在此处输入图片说明

如果我们在模型中添加三个指标,我们将得到 在此处输入图片说明

然后我们可以估计

在此处输入图片说明

并接收残差和acf的图

在此处输入图片说明

在此处输入图片说明

该acf建议我们向模型添加潜在的两个移动平均系数。因此,下一个估计的模型可能是。

在此处输入图片说明

屈服

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明 在此处输入图片说明 在此处输入图片说明 然后,可以删除不重要的常量,并得到一个改进的模型: 在此处输入图片说明

我们注意到,不需要任何幂变换就可以得到一组具有恒定方差的残差。请注意,这些预测不是爆炸性的。

在此处输入图片说明

在此处输入图片说明

根据一个简单的加权和,我们有:13个权重;3非零且等于(1.0.1,0。,-1.0)

在此处输入图片说明

在此处输入图片说明

该材料以非自动的方式呈现,因此在进行建模决策时需要用户交互。


嗨IrishStat,又是我。我喜欢您的大量示例,但是有两个段落(至少对我而言)有些晦涩:“此系列的自相关错误地表明“一切都很好”,可能需要进行任何Ma(1)调整”和“此acf建议我们向模型中添加潜在的两个移动平均系数”。您在那些使您相信的ACF图中看到了什么?他们俩看起来都还不错吗(几乎所有值都在“蓝线”之内)?
Bruder 2012年

:VBruder我认为我对“可能存在一个...”的说法“错了”。在第二个示例中,有证据表明在滞后1和滞后12处存在“不良acf”,这表明可能需要t 2o ma系数。您过于相信这些限制,因为acf91)和acf(12)处于“危险地接近”状态。您可以直接从我的信息中找到我发布的电子邮件地址与我联系。
IrishStat '02

很好写。“ ARIMA模型反映了对三个异常数据点的调整”您说要为这三个点添加三个虚拟变量吗?用外行的话来说,这三个离群值在未来的预测中如何解释?(我确定它很简单,我只是不熟悉。)而且,随着时间的流逝,您的错误范围似乎不会变大。(或者错误界限取决于步骤的方式?)预先感谢。
亚当

@Adam这三个虚拟变量在预测中不起作用,因为将来的值都为0。是的,所显示的误差范围不正确。我们已经解决了该缺陷,现在随着时间的流逝,AUTOBOX呈现出越来越大的错误界限。我是AUTOBOX的开发商之一。。
IrishStat 2012年

@IrishStat“三个虚拟变量在预测中不起作用,因为将来的值都为0。”这是否实质上意味着它们已从数据中拉出?它们一定会对预测极限产生影响吗?
亚当


3

我建议使用艾伦·潘克拉茨(Alan Pankratz)的单变量框预测-詹金斯模型:概念和案例。这本经典的书具有您要求的所有功能:

  • 使用最少的数学
  • 将讨论从构建模型扩展到使用该模型预测特定案例
  • 使用图形和数值结果来表征预测值和实际值之间的拟合度。

唯一的缺点是它于1983年印刷,可能没有最新的进展。出版商将于2014年1月发行第二版,并进行了更新。


我还会推荐Alan Pankratz的另一本书:《使用动态回归模型进行预测》。非常相似的材料,但覆盖更多的地面;尽管在Box-Jenkins方面不太详细。得知2014年1月即将发布第二版,真是太好了!
Graeme Walsh 2013年

-4

ARIMA模型只是加权平均值。它回答了双重问题。

  1. 我应该使用多少个周期(k)计算加权平均值

  1. 精确地,k的权重是多少

它回答了处女的祈祷,以确定如何调整到先前的值(和先前的ALONE值)以投影序列(这实际上是由未指定的因果变量引起的),因此ARIMA模型是穷人的因果模型。


-1这个答复似乎没有回答这个问题,它正在寻找“解释清楚的... *示例*”。
ub

@whuber:OP要求回答“使用最少的数学”。我的回答详述了最少的数学运算,并激发了用日常常用词解释ARIMA模型的动机。这是永远不会做的,因为数学理论的人专注于使用多项式,微分算子,非线性优化等的“高端解释”
。– IrishStat

@爱尔兰我同意降低数学运算的动机,尤其是在用户要求时。但是这个答复似乎回答了一个不同的问题:“什么是ARIMA”。原始问题的具体性质还表明,OP对ARIMA是什么以及它有什么好处有很好的了解。他们希望看到它的实际应用。 我敢打赌,您可以轻松地撰写这样的案例研究:-)。
ub

:whuber:那对我来说很容易做到,我可能会那样做。
IrishStat

@爱尔兰我很期待看到它。此外,这个问题并未在这里出现,但在其他地方也出现了。与许多其他明显的营销形式相比,这种贡献可能使人们知道您可以做些什么的方式更加强大,并且受到更多的赞赏。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.