R中具有多个外生变量的Arima时间序列预测(auto.arima)


14

我想基于具有多个外生变量的多个时间序列ARIMA模型进行预测。由于我对统计数据和RI都不希望保持尽可能简单(3个月的趋势预测就足够了)。

我有1个相关的时间序列和3-5个预测器时间序列,所有月度数据,无间隔,同时为“水平”。

我遇到了auto.arima函数,并问自己这是否适合我的问题。我有不同的商品价格和用它们制成的产品的价格。所有原始数据都是非平稳的,但是通过一阶微分,它们都变成了平稳数据。ADF,KPSS对此进行了说明。(这意味着我已经对集成进行了测试,对吗?)。

我现在的问题是:如何将它与auto.arima函数一起应用,而且ARIMA是否是正确的方法?一些人已经建议我使用VAR,但是ARIMA也可以吗?

下表是我的数据。实际上,数据集直到105个观测值为止,但前50个观测值可以。在这里,趋势和季节性显然很有趣。

在此处输入图片说明

感谢您的任何建议和帮助!格奥尔格


请发布您的数据以便下载。使用excel。这可能只是识别不必要的(可能是显着互相关的)输入序列的任务。我不认为VAR是必要的或对这个问题有用的主成分
IrishStat 2014年

Answers:


10

如果您的外部回归变量是因果,但不是相反的,并且互不引起,则ARIMA绝对合适。如果您的不同时间序列都相互依赖,则VAR有意义。y

auto.arima()使用外部回归变量,请将回归变量收集到一个矩阵中X,然后将其输入的xreg参数中auto.arima()。(当然,X必须与y建模的时间序列具有相同的行数。)

为了进行预测,您将需要回归器的未来值,然后将其再次输入到的xreg参数中forecast

帮助页面为?auto.arima?forecast.Arima(请注意大写字母A-这不是错字。请不要问我...)。


1
(+1)您可以详细说明因果关系的概念以及如何进行检验。由于您提到使用ARIMA的决定取决于变量之间因果关系的方向,因此这可能有助于答案的完整性。您是否正在考虑格兰杰因果关系检验豪斯曼检验?谢谢。
javlacalle 2014年

3
@javlacalle:我不是因果关系统计测试的忠实拥护者(其中最著名的是格兰杰测试)。我更喜欢根据主题决定“可能的因果关系”。例如,我不会使用Granger检验来评估降价是否会增加超市的销售量或反之。GDP,汇率和创造就业机会也不是相互因果的。在这两种情况下,问题似乎都显而易见,并且与理论相符的测试不会教给我们任何东西,而与理论相抵触的测试只会令人困惑(并且可能仅是噪音)。
Stephan Kolassa,2014年

1
...我知道我对自己的最后
一句话表示欢迎

// @斯蒂芬:谢谢你的投入。尽管y是由我的回归变量引起的,而不是相反的,但我的回归变量之间确实存在相关性,并且也应该或多或少地相互影响。根据您的评论,这意味着我应该使用VAR而不是arima,因为这样可以避免问题(?)。我在这里使用了一堆商品/产品价格,在一定程度上,它们基本上彼此相关。“原材料”是我的Y,价值链中的产品以及副产品等都是我的预测指标。
乔治

1
知道数据的上下文总是有帮助的,任何分析的结果都应该与我们的先验知识进行比较。尽管如此,还是要谨慎一些。直觉有时会失败,有时被认为理所当然的理论依赖于事实不支持的假设。但我理解您的意思并总体同意。
javlacalle 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.