分析ACF和PACF图


21

我想看看我是否在分析我的ACF和PACF曲线的正确轨道上:

在此处输入图片说明

背景:(参考文献:菲利普·汉斯·弗朗西斯,1998年)

  1. 由于ACF和PACF都显示出重要的价值,因此我认为ARMA模型将满足我的需求

  2. ACF可用于估计MA部分,即q值,PACF可用于估计AR部分,即p值

  3. 为了估计模型阶数,我查看了a。)ACF值是否足够消亡,b。)ACF信号是否过度差分,以及c。)ACF和PACF在某些滞后是否显示任何明显且易于解释的峰值

  4. ACF和PACF可能不仅建议一种模型,而且在考虑其他诊断工具后需要从许多模型中进行选择

考虑到这一点,我继续说,最明显的模型似乎是ARMA(4,2),因为ACF值在滞后4处消失,而PACF在1和2处出现尖峰。

另一种分析方法是ARMA(2,1),因为我看到我的PACF中出现两个明显的峰值,而我的ACF中出现一个明显的峰值(此后,值从更低的点(0.4)开始消失。

查看我的样本内预测结果(使用简单的平均绝对百分比误差),ARMA(2,1)的结果要比ARMA(4,2)好得多。所以我使用ARMA(2,1)!

您能否确认我的分析ACF和PACF图的方法和发现?

帮助赞赏!

编辑:

描述性统计:

count  252.000000
mean    29.576151
std      7.817171
min     -0.920000
25%     26.877500
50%     30.910000
75%     34.915000
max     47.430000

Skewness of endog_var: [-1.35798399]

Kurtsosis of endog_var: [ 5.4917757]

Augmented Dickey-Fuller Test for endog_var: (-3.76140904255411, 0.0033277703768345287, {'5%': -2.8696473721448728, '1%': -3.4487489051519011, '10%': -2.5710891239349585}

时间序列:

在此处输入图片说明

残差(ARMA(2,1):

在此处输入图片说明

ACF / PACF残差:

在此处输入图片说明

编辑二:

数据:

14.37561
23.95561
25.41561
13.88561
23.31561
33.12561
35.30561
35.78561
37.21561
35.23561
37.34561
38.28561
39.03561
36.34561
39.08561
39.34561
38.80561
40.10561
34.13561
35.42561
27.29561
34.13561
39.89561
47.77561
40.57561
36.15561
33.66561
30.97561
24.90561
23.41561
0.31561
8.45561
37.36561
33.40561
13.97561
11.62561
35.07561
36.15561
37.09561
36.95561
37.85561
32.31561
35.41561
36.35561
37.34561
35.90561
37.40561
36.44561
37.37561
36.16561
35.24561
38.47561
39.18561
39.61561
29.55561
35.50561
38.05561
40.32561
44.39561
37.65561
46.27561
29.41561
40.41561
33.44561
37.04561
35.34561
25.24561
30.23561
15.40561
26.79561
35.38561
40.22561
43.14561
36.96561
41.93561
11.30561
6.87561
32.92561
34.54561
38.27561
36.40561
25.44561
37.26561
26.39561
31.13561
35.90561
38.41561
33.66561
33.16561
31.96561
30.34561
37.77561
32.25561
33.21561
38.37561
36.63561
40.78561
35.60561
36.37561
34.42561
42.67561
33.40561
31.49561
24.81561
23.82561
37.34561
30.73561
21.04561
18.20561
27.36561
18.49561
25.41561
27.92561
29.42561
25.91561
27.56561
28.69561
29.89561
31.47561
29.34561
25.35561
21.98561
28.61561
33.87561
20.07561
27.36561
26.48561
20.37561
22.33561
28.52561
21.24561
10.77561
18.69561
30.19561
33.89561
29.81561
27.55561
22.37561
20.32561
22.43561
31.89561
32.10561
27.67561
36.93561
36.51561
26.96561
21.27561
34.68561
34.13561
35.80561
25.38561
33.42561
9.28561
8.70561
30.36561
30.29561
29.56561
28.41561
33.40561
18.47561
16.48561
18.51561
26.35561
25.40561
19.92561
21.26561
10.90561
32.71561
26.71561
29.99561
28.87561
28.55561
14.07561
10.97561
24.92561
26.40561
21.40561
29.08561
30.18561
30.27561
16.15561
21.96561
32.29561
29.57561
30.24561
30.82561
28.83561
27.30561
26.53561
28.39561
29.76561
29.50561
31.81561
34.79561
24.14561
31.34561
33.14561
35.04561
33.20561
33.53561
35.28561
29.84561
35.02561
33.63561
35.65561
35.73561
35.35561
37.18561
27.38561
34.40561
33.69561
29.05561
34.55561
31.76561
30.91561
34.70561
35.87561
28.31561
30.39561
28.03561
30.72561
30.57561
23.93561
25.11561
32.15561
26.74561
28.76561
32.49561
34.79561
27.90561
33.05561
29.50561
31.67561
34.36561
36.88561
32.31561
26.24561
26.66561
33.59561
37.64561
38.26561
36.20561
33.27561
29.94561
29.19561
27.41561
37.24561
36.26561
30.84561
35.46561
32.24561
31.44561
33.40561
30.71561
33.03561
36.43561
33.44561
22.32561
18.65561
31.97561
27.00561
29.66561
30.76561
33.44561
29.19561
12.32561
33.41561
37.13561
33.43561
37.35561
40.17561
29.38561
19.70561
35.44561
30.48561
30.72561
16.09561
30.82561
30.55561
34.38561
35.45561
34.87561
33.78561
33.87561
29.83561
26.35561
26.44561
28.72561
30.85561
28.18561
12.18561
31.82561
18.01561
27.57561
29.38561
20.32561
22.36561
34.01561
34.40561
20.23561
-0.57439
9.87561
29.55561
31.01561
30.00561
28.12561
13.47561
7.42561
22.01561
20.38561
27.57561
31.54561
29.90561
16.40561
21.27561
26.22561
31.47561
31.11561
32.97561
32.34561
29.36561
32.40561
31.16561
32.05561
31.78561
32.34561
33.87561
31.80561
29.90561
30.09561
32.36561
28.15561
26.30561
15.32561
31.03561
33.47561
33.44561
33.71561
28.30561
12.70561
10.17561
43.96561
9.58561
35.38561
33.82561
41.37561
33.40561
33.64561
20.30561
27.85561
29.01561
32.36561
28.33561
29.90561
27.19561
0.39561
8.40561
0.24561
11.87561
29.15561
20.40561
0.42561
29.29561
23.39561
19.36561

数据看起来有点偏斜,也许是不稳定的。在我看来,残差存在一些潜在问题,甚至可能是条件异方差。
Glen_b-恢复莫妮卡2015年

在我看来,偏度表明只有通过分析原始数据才能确认异常值(脉冲)。
IrishStat

Answers:


8

在整个分析环境中,查看ACF和PACF也很有用。您的Ljung-Box Q统计数据;p值 置信区间,应同时查看ACF和PACF。例如这里的Q测试:

acf, ci, Q, pvalue = tsa.acf(res1.resid, nlags=4,confint=95,  qstat=True, unbiased=True)

在这里-我们的自相关Q检验是对我们的图形解释的整体直觉检查。

关于Statsmodels中的时间序列分析的注释草案:http ://conference.scipy.org/proceedings/scipy2011/pdfs/statsmodels.pdf


14

在60年代中期,仅使用ACF和PACF所建议的工具有时是正确的,但除模拟数据外很少正确。诸如AIC / BIC之类的模型识别工具几乎永远无法正确识别有用的模型,而是显示当您不阅读有关假设的小字时会发生什么。我建议您尽可能简单地开始,但不要太简单,并估计一个初步的模型; Glen_b建议的AR(1)。此暂定模型的残差/分析可用于计算另外一个ACF和PACF,这表明可能会增加模型或简化模型。请注意,您的参考资料中的解释要求当前的序列/残基不具有任何确定性结构,例如,脉冲,电平移位,本地时间趋势和季节性脉冲,此外该系列具有恒定的误差变化,并且暂定模型的参数随时间不变。如果您希望可以发布数据,我将尽力帮助您形成有用的模型。

报告数据后进行编辑:

交付并分析了365个值,得出了具有已识别的Pulses和2 Level Shifts的以下AR(1)模型。在此处输入图片说明。请注意,这是一个普遍的猜测。此模型的残差在此处绘制在此处输入图片说明。有一种建议是方差异方差,但这是一种症状,需要找到我们最终会找到的正确方法。继续显示此处在此处输入图片说明显示的残差的acf表示模型不足。在这里仔细查看残差的ACF表在此处输入图片说明建议在滞后7和滞后14的结构。将这两个线索放在一起(样本量为365,每周有大量样本,即滞后7结构),我决定调查这是否确实是每日数据。新用户在错误地认为计算机应该足够聪明以至于可以弄清楚一切的前提下定义数据时,通常会忽略非常重要的信息。请注意,在OP'S ACF和PACF图中,滞后7和滞后14线索被淹没了。残差中确定性结构的存在会增加误差方差,从而抑制acf。一旦发现异常值/脉冲/水平移动,ACF就会显示出自回归结构/每日指标的存在,然后需要加以考虑。

然后,我分析了数据,使软件可以继续了解每天的数据。仅使用365个值,就不可能正确构建包含季节/假日预测变量BUT的模型,而这些模型可能需要一年以上的数据。

此处找到的模型在此处输入图片说明包含5个每日虚拟模型,两个水平移位,多个脉冲和(1,0,0)(1,0,0)形式的Arima模型。残差图不再证明存在非恒定性结构,因为存在更好的模型。在此处输入图片说明。钍在此处输入图片说明残差电子ACF干净多了。“实际/已清洁”图突出显示了异常脉冲点。在此处输入图片说明。此处的教训是,当在没有关键信息的情况下分析数据时,这是每天的时间序列,就会有大量的脉冲反映出表示不充分的信息(或者可能是对日常线索的高级了解)。此处提供了实际/适合和预测在此处输入图片说明

看看其他人将如何处理相同的数据集将很有趣。请注意,所有分析都是使用市售软件以免提模式进行的。


1
清晨误读...通常在我的图表中看不到滞后(0)
IrishStat

1
一开始它也欺骗了我。
Glen_b-恢复莫妮卡2015年

感谢您的回答。由于没有时间序列预测领域的经验,因此很难完全理解选择正确模型的过程,因为没有正式正确的方法。不幸的是,我不允许发布我的原始数据。我希望其他信息对您有所帮助(请参阅“编辑:”)
Peter Knutsen

您可以在展示数据之前缩放/屏蔽数据。查看该图,可能会出现一些不正常的值,如果不进行向下处理,则会使acf和pacf不正确地表明存在充分性。在视觉上暗示下降趋势,然后没有趋势,但这只是目前的猜测。
IrishStat 2015年

我只是说,你可能会使用一些数据..
彼得Knutsen的

11

在我看来,您正在计算滞后0的峰值。

您的PACF在滞后1处显示一个相当大的峰值,表明AR(1)。当然,这将导致ACF呈几何状下降(从广义上讲,您会看到)。您似乎试图两次满足相同的依赖性-AR和MA。

我刚开始尝试过AR(1),看是否还有值得担心的问题。


彼得 我的答案中有一个错字(我在上一段中有AR(1)正确,但在第二段中键入了MA(1)),现在已修复。
Glen_b-恢复莫妮卡2015年

感谢您的回答。从滞后0开始计数当然是一个主要错误!我尝试了AR(1),结果却不如ARMA(2,1)!
彼得·努特森

很可能情况不是那么好-尽管如此,AR(1)将是一个起点。例如,残差的PACF是什么样的?原始系列是什么样的?从数据的ACF和PACF中无法轻松收集到很多可能发生的情况。
Glen_b-恢复莫妮卡

谢谢。我发布了一些其他信息,这些信息可能会带来新的见解。
彼得·努特森
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.