我最近在寻找重新采样时间序列的方法,
- 大约保留长存储进程的自相关。
- 保留观测值的范围(例如,重新采样的整数时间序列仍然是整数的时间序列)。
- 如果需要,可能只影响某些比例尺。
我针对长度为的时间序列提出了以下排列方案:
- 通过成对的连续观测值对时间序列进行分类(有这样的分类)。分别以概率翻转它们中的每一个(即,从索引到)。
1:2
2:1
- 通过连续的观察值对获得的时间序列进行分类(其中有这样的分类)。用概率反转它们中的每一个(即从索引到索引)独立性。2 N - 2
1:2:3:4
4:3:2:1
- 与尺寸的仓重复该步骤,,...,总是逆转与概率仓。16 2 Ñ - 1 1 / 2
这种设计纯粹是经验性的,我正在寻找已经针对这种排列发布的作品。我也乐于接受其他排列或重采样方案的建议。
您的过程很有趣,但是正如您所描述的,在我看来,如果最大块大小为则基本上将数据划分为个连续的块,然后在每个块中对每个实例进行置换是等概率的。2 (N - k )
—
muratoa 2012年
除了成对之外,您还可以定义和。这样,您可以确保至少保留个点,并且最多可以移动的距离。 k max 2 k min 2 k max
—
muratoa 2012年
@muratoa感谢您的反馈。我不确定我会遵循。如果是最大块大小,则该方案与块内的置换对不同。例如,对于,您可以获得概率为1/8 的顺序,这不是配对排列。至于和,这是我在第3点中提到的。这是从和改洗标度的方法。 k = 2 k 最小值 k 最大值 k 最小值 k 最大值
—
gui11aume12 2012年
4:3:2:1
你说得对,我没有正确地读出你的第一个项目,我想最小尺寸为2
—
muratoa