如何在预测中考虑假期的影响


12

我有一个相当可预测的每日时间序列和每周季节性。在没有假期的情况下,我能够提出看起来很准确的预测(通过交叉验证确认)。但是,当有假期时,我会遇到以下问题:

  1. 尽管所有历史假期均为0,但我在预测中得到的假期非零数字。但这实际上不是主要问题。问题是...
  2. 由于假期中不进行的处理会“溢出”到假期后的几天,因此,由于这些异常值似乎是短期的创新,因此无法使用简单的虚拟变量进行削减。如果没有每周的季节性变化,我可能会得出一个估计值,用于在假期后的五天左右的时间内分配假期中未处理的数据(如您如何创建反映假期的超前和滞后影响的变量中建议的/时序分析中的日历效果?)。但是,“溢出”的分布取决于假期发生的星期几,以及假期是否是圣诞节或感恩节,那里的订单订购率低于一年中的其余时间。

以下是我的交叉验证的一些快照,这些快照显示了在一周的不同日期出现的假期的预测(蓝色)与实际(红色)结果:

在此处输入图片说明

我还担心圣诞节的影响取决于它落在一周中的哪一天,而我只有六年左右的历史数据。

对于在预测的背景下如何应对这些类型的创新异常值,是否有人有任何建议?(很遗憾,我无法共享任何数据)


1
我对此也很感兴趣。
EngrStudent

2
如果您无法发布数据,那么也许可以发布与数据相似的虚假数据?在许多情况下,这有助于获得更相关的答案。
蒂姆

1
缩放数据。模型将是相同的(按比例缩放)。您甚至可以将预测重新调整为原始指标。
汤姆·赖利

Answers:


1

您是否不能为假日创建一个虚拟变量,为假日+1创建一个虚拟变量,为假日+2创建一个虚拟变量,并且只在工作日内将它们设置为1?

至于感恩节和圣诞节,在这些假期中引入单独的虚拟变量似乎是最糟糕的选择(因为您只有六年的数据)。在某种程度上,这可能是您唯一的选择-人们在假日期间的行为方式与他们在7月四日的行为方式不同(而且,如果您正在研究零售模式,那么您肯定必须与那些人一起生活)是“特殊”假期,因此一定要分别对其进行分析)。但是,以下想法可能对您有所帮助:

  • 感恩。它总是位于一周的同一天(星期四)的事实是否应该使它更容易?也就是说,即使在六年数据集中,感恩节假人也可能是可行的,因为工作日模式将始终相同。
  • 圣诞。从您的图表看来,主要问题是效果的持续时间比其他假期长-如果您将“圣诞节”定义为平安夜(12月24日),那是因为许多人也会留在家里圣诞节(12月25日)(某些地方甚至还有节礼日(12月26日))。我会考虑更多。

我希望这有帮助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.