如何对时间序列进行预测?


9

我对时间序列数据的分析并不熟悉。但是,我有一个简单的预测任务要解决。

我从一个普通的生成过程中获得了大约五年的数据。每年代表具有非线性成分的单调递增函数。在每年的40周周期中,我每周都有计数。过程开始,函数从零开始,在函数的前半部分相当快地增加,在后半部分中变慢,然后在最后五周内变平。多年以来,这一过程是一致的,每年各个细分市场的变化率和数量差异很小。

y1={0,Nt1,Nt2,...Nt39,Nt40}

y5={0,Nt1,Nt2,...Nt39,Nt40}

哪里 Ntx 等于时间x的计数。

目标是 Ntx (或更好 t0tx,或指向该点的坡度)并预测 Nt40。例如,如果Nt10 是5000的期望值是多少 Nt40那年。因此,问题是,您将如何为此类数据建模?总结和可视化非常容易。但是我想要一个模型来促进预测并结合误差度量。


2
您确定要严格限制自己吗?如果此问题有任何实际应用,那么到您知道时间x的计数时,您还将知道所有先前的计数。为什么不使用它们来帮助进行预测?
Whuber

确实。没错 感谢您指出了这一点。
Brett 2010年

Answers:


6

正如Andy W建议的那样,最简单的方法可能是使用季节性单变量时间序列模型。如果您使用R,请尝试使用auto.arima()ets()预测包中进行选择

两种方法都可以正常运行,但是一般的时间序列方法不会使用提供的所有信息。特别是,您似乎似乎知道每年的曲线形状,因此最好通过相应地对每年的数据进行建模来使用该信息。以下是尝试合并此信息的建议。

听起来有些S形曲线可以解决问题。例如,物流转移:

FŤĴ=[RŤË一个ŤĴ-bŤ1个+Ë一个ŤĴ-bŤ
一年 Ť 和一周 Ĵ 哪里 一个ŤbŤ[RŤ 是要估计的参数。 [RŤ 是渐近最大值, 一个Ť 控制增长率 bŤ 是中点时 FŤĴ=[RŤ/2。(将需要另一个参数以允许您描述不对称性,从而使增长率随时间变化。bŤ 比之后更快 bŤ。最简单的方法是允许一个Ť 在时间之前和之后取不同的值 bŤ

可以使用每年的最小二乘法来估计参数。每个参数形成时间序列:一个1个一个ñb1个bñ[R1个[Rñ。这些可以使用标准时间序列方法进行预测,尽管ñ=5除了使用每个系列的均值来生成预测之外,您可能无能为力。然后,对于第6年,估算第一周的价值Ĵ 很简单 F^6Ĵ 哪里的预测 一个6b6[R6 被使用。

一旦开始观察第6年的数据,您将需要更新此估计。在获得每个新观测值后,估计从6年级开始的数据的S形曲线(您将需要至少三个观测值作为开始,因为有三个参数)。然后取使用直到5年的数据获得的预测的加权平均值和仅使用6年的数据获得的预测的加权平均值,其中权重等于40-Ť/36Ť-4/36分别。这是非常临时的,我相信可以通过将其放在更大的随机模型中来使其更加客观。尽管如此,它可能会为您的目的正常工作。


4

您的询问本质上是Box Jenkins ARIMA建模的作用(您的年度周期称为季节成分)。除了自行寻找资料外,我建议

麦克莱里(R McCleary)1980年社会科学的应用时间序列分析 ; RA Hay; EE Meidinger; 麦克多沃尔

尽管我可以想到合理的理由来解释为什么要对未来进行进一步的预测(从而评估这样做时的错误),但是在实践中通常非常困难。如果您的季节因素非常强大,则将更可行。否则,您的估算值可能会在相对较短的未来时间内达到平衡。

如果您打算使用R来拟合您的模型,则可能应该查看Rob Hyndman的网站(希望他会给您比我更好的建议!)


-2

您有5年的数据,每年40次观察。您为什么不将它们发布到网络上,让我们以零地面为单位进行实际回答,而不是在500英里高处进行哲学思考。我期待这些数字。我们已经看到了这样的数据,例如每周一次的时间共享周中进行交易的客户数量。每年的系列从零开始并累积到极限值。


1
-1这听起来像是自我广告,而不是有用的答复。
ub

@whuber:不是故意的。这只是我遇到的类似“粘性问题”的反映。
IrishStat

那么,这将引起一个有趣的评论。评论是注入一些宝贵经验的好方法,我们非常高兴您与我们分享。应该保留对问题的实际回答的答复:将对它们进行投票,存档,使其可搜索等,因此,它们应更直接相关,具有永久价值,并能够更好地承受批评。(当然,这是理想化的,但它是我们争取:-)。
whuber

@whuber:你教!我学习 !我将为“评论区”保留评论。重申一下,绝对没有推广任何东西或任何特定软件/咨询的意图,只是出于与村里其他人分享经验的良好意愿。我非常确定,OP认为我的意见很有帮助。你怎么说布雷特?
IrishStat
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.