我正在尝试预测一个时间序列,为此我使用了季节性ARIMA(0,0,0)(0,1,0)[12]模型(= fit2)。它与R关于auto.arima的建议不同(R计算得出的ARIMA(0,1,1)(0,1,0)[12]会更好,我将其命名为fit1)。但是,在我的时间序列的最后12个月,我的模型(fit2)在调整后似乎更合适(长期存在偏差,我添加了剩余均值,新的拟合似乎更贴近原始时间序列这是过去12个月的示例,MAPE最近12个月的两种情况:
时间序列如下所示:
到目前为止,一切都很好。我对这两个模型都进行了残差分析,这就是困惑。
acf(resid(fit1))看起来很棒,非常白噪声:
但是,Ljung-Box测试不适用于例如20个滞后:
Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)
我得到以下结果:
X-squared = 26.8511, df = 19, p-value = 0.1082
据我了解,这是对残差不是独立的确认(p值太大,无法与独立假设一起保留)。
但是,对于滞后1来说,一切都很好:
Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)
给我结果:
X-squared = 0.3512, df = 0, p-value < 2.2e-16
我可能不理解该测试,或者与我在acf图上看到的有些矛盾。自相关性很低。
然后我检查了fit2。自相关函数如下所示:
尽管在最初的几个滞后处存在如此明显的自相关,但Ljung-Box测试在20个滞后处给我的结果比fit1好得多:
Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)
结果是 :
X-squared = 147.4062, df = 20, p-value < 2.2e-16
而仅仅在lag1处检查自相关,也可以得到零假设的证实!
Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
X-squared = 30.8958, df = 1, p-value = 2.723e-08
我是否正确理解测试?为了确认残差独立性的零假设,p值最好小于0.05。哪种拟合更适合用于预测,拟合1或拟合2?
附加信息:fit1的残差显示正态分布,fit2的残差不显示正态分布。
X-squared
残差的样本自相关变大时,Ljung-Box检验统计量()变大(请参见其定义),并且其p值是获得等于或大于零值下观察到的值的概率真正的创新是独立的假设。因此,小的p值是反对独立性的证据。
fitdf
),因此您正在针对自由度为零的卡方分布进行测试。