作为附带的兴趣,我一直在探索预测时间序列(尤其是使用R)。
就我的数据而言,我有每天的访问次数,可以追溯到将近4年的每天。在此数据中,有一些不同的模式:
- 周一至周五的访问量很多(周一/周二最高),但周六至周日的访问量则大大减少。
- 一年中的某些时段下降(例如,美国假期前后的访问量减少,夏季显示出较少的增长)
- 年比显着增长
能够使用这些数据来预测未来的一年,并使用它来进行季节性调整后的逐月增长,这将是很好的。每月查看的主要内容是:
- 某些月份的星期一/星期二会比其他月份要多(而且多年以来也不一致)。因此,需要对平日较多的一个月进行相应的调整。
探索周似乎也很困难,因为周编号系统会根据年份从52-53更改,并且似乎ts
无法解决这一问题。
我正在考虑为一个月的工作日取平均值,但是结果得出的单位有点奇怪(平均工作日访问次数的增长),并且会删除有效的数据。
我觉得这种数据在时间序列中很常见(例如,办公楼中的用电量可能是这样的),有人对如何建模有任何建议,尤其是在R中?
我正在使用的数据非常简单,它开始如下:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
并以这种方式一直延续到现在,总体呈增长趋势,在美国假期周前后有所下降,而夏季的增长总体上放缓。
数据的另一个有趣方面是,突然发生的事件将整个增长趋势中断了大约几个月。但是现在,我正处于尝试正确设置季节性的阶段,但我忽略了这一方面。
—
凯尔·勃兰特
另外,如果我没有正确使用“季节性”,请更正我。我目前正在考虑在我所说的时间范围内的一种模式。因此,“每周季节性”对我来说意味着“每周重复一次的模式”。
—
凯尔·勃兰特
请参阅stats.stackexchange.com/questions/14742/…的答案。可能是一个起点。
—
彼得·埃利斯
也许这是周+年的组合的核心?似乎
—
Kyle Brandt 2012年
ts
(甚至msts
)不适合一周的采样期和一年的“自然”期(我想日历也不可以)。或者,我就是不明白该如何做……