我有一个时间序列的预测模型,我想计算其样本外预测误差。目前,我遵循的策略是Rob Hyndman的博客(在页面底部附近)建议的策略(假设时间序列和大小为的训练集)
- 使模型适合数据并让作为下一个观测值的预测。
- 将预测误差计算为。
- 重复
- 将均方误差计算为
我的问题是,由于我的训练集重叠,我有多少需要担心相关性。特别要说的是,我不仅要预测下一个值,还要预测接下来的值,这样我就可以预测\ hat {y} _ {t + k},\ dots,\ hat {y} _ {t + k + m-1}和错误e_ {t,1},\ dots,e_ {t,m},我想构造一个预测错误的术语结构。
我是否仍可以每次将训练集的窗口向前滚动1个,还是应该向前滚动?如果我要预测的序列中存在显着的自相关,那么这些问题的答案将如何改变(可以想象这是一个长记忆过程,即自相关函数随幂定律而不是指数衰减。)
我希望在这里提供解释,也可以链接到可以找到有关MSE(或其他误差度量)的置信区间的理论结果的地方。