问题: 我想确定一点,使用带有时间序列的k折叠交叉验证是否简单明了,还是在使用它之前需要特别注意?
背景: 我正在建模一个6年的时间序列(使用半马尔可夫链),每5分钟有一个数据样本。为了比较多个模型,我使用了6倍交叉验证,即通过分离6年中的数据,所以我的训练集(用于计算参数)的长度为5年,而测试集的长度为1年。我没有考虑时间顺序,因此我的不同设置是:
- fold 1:训练[1 2 3 4 5],测试[6]
- 第二折:训练[1 2 3 4 6],测试[5]
- 第三折:训练[1 2 3 5 6],测试[4]
- 第四步:训练[1 2 4 5 6],测试[3]
- 第五步:训练[1 3 4 5 6],测试[2]
- 第六步:训练[2 3 4 5 6],测试[1]。
我提出的假设是,每年彼此独立。我该如何验证?有没有参考资料显示k倍交叉验证与时间序列的适用性。