R forecast
包以及zoo
用于不规则时间序列和内插缺失值的包给我留下了深刻的印象。
我的应用程序是在呼叫中心流量预测方面,因此(几乎)总是缺少周末的数据,可以通过很好地处理zoo
。此外,一些离散的点可能会丢失,我只是用的r NA
为。
事实是:所有的预测包的漂亮的魔法,比如eta()
,auto.arima()
等等,似乎期望普通ts
的物体,不包含任何丢失的数据,即等间隔的时间序列。我认为在现实世界中仅存在等时时间序列的应用确实存在,但是-我认为-非常有限。
几个离散的问题NA
的值可容易地通过使用任何的提供内插函数来解决zoo
,以及通过forecast::interp
。之后,我运行了预测。
我的问题:
- 有人建议更好的解决方案吗?
(我的主要问题)至少在我的应用程序域中,呼叫中心流量预测(据我所能想象的大多数其他问题域),时间序列不是等距的。至少我们有重复的“工作日”计划或类似的计划。什么是最好的处理方式,同时仍然使用预测包的所有酷魔术?
我是否应该“压缩”时间序列以填充周末,进行预测,然后再次“充气”数据以在周末重新插入NA值?(我认为这是一种耻辱吗?)
是否有计划使预测程序包与不定期的时间序列程序包(如Zoo或其兼容程序)完全兼容?如果是,何时和否,为什么不呢?
我对预测(以及一般的统计数据)还很陌生,所以我可能会忽略一些重要的事情。
auto.arima
可以处理缺失值。