时间序列预测的数据增强策略

13

我正在考虑两种策略来对时间序列进行“数据增强”。

首先，有一点背景知识。预测时间序列下一步的预测变量 $P$ 通常取决于以下两个函数：时间序列的过去状态，以及预测变量的过去状态： $\lbrace A_i\rbrace$

P （ {{一个}_{一世 \leq Ť - 1个}} ， P_{{小号}_{Ť - 1个}} ）

$P(\lbrace A_{i\leq t-1}\rbrace,P_{S_{t-1}})$

如果我们想调整/训练我们的系统以获得一个好的，那么我们将需要足够的数据。有时可用数据还不够，因此我们考虑进行数据扩充。 $P$

第一种方法

假设我们有时间序列，具有。并且还假设我们有满足以下条件：。 $\lbrace A_i \rbrace$ $1 \leq i \leq n$ $\epsilon$ $0<\epsilon < |A_{i+1} - A_i| \forall i \in \lbrace 1, \ldots,n\rbrace$

我们可以构造一个新的时间序列，其中是分布。 $\lbrace B_i = A_i+r_i\rbrace$ $r_i$ $N(0,\frac{\epsilon}{2})$

然后，除了仅在上使损失函数最小化之外，我们还在进行损失最小化。因此，如果优化过程需要步，我们必须将预测变量“初始化”次，并且我们将计算大约预测变量内部状态。 $\lbrace A_i \rbrace$ $\lbrace B_i \rbrace$ $m$ $2m$ $2m(n-1)$

第二种方法

我们像以前一样计算，但是我们不使用更新预测器的内部状态，而是使用更新预测器的内部状态。在计算损失函数时，我们仅将两个序列一起使用，因此我们将计算大约预测变量内部状态。 $\lbrace B_i \rbrace$ $\lbrace B_i \rbrace$ $\lbrace A_i \rbrace$ $m(n-1)$

当然，这里的计算工作量较少（尽管该算法有点难看），但现在并不重要。

怀疑

问题是：从统计角度来看，哪个是“最佳”选项？又为什么呢？

我的直觉告诉我，第一个更好，因为它有助于“规范化”与内部状态相关的权重，而第二个仅有助于规范与观察到的时间序列过去的权重。

额外：

还有其他想法可以对时间序列进行数据增强吗？
如何对训练集中的综合数据加权？

time-series data-augmentation

— 卡斯塔尔科
source

6

还有其他想法可以对时间序列进行数据增强吗？

我目前正在考虑相同的问题。我发现了Le Guennec等人的论文“使用卷积神经网络进行时间序列分类的数据增强”。但其中不包括预测。那里提到的增强方法仍然看起来很有希望。作者交流了两种方法：

窗口切片（WS）

从计算机视觉社区[8,10]得到启发的第一种方法是从时间序列中提取切片，并在切片级别进行分类。在[6]中已经为时间序列引入了该方法。在训练中，将从类别y的时间序列中提取的每个切片分配给同一类别，并使用这些切片学习分类器。切片的大小是此方法的参数。在测试时间，使用学习到的分类器对测试时间序列中的每个片段进行分类，并进行多数表决以决定预测的标签。在下文中将该方法称为窗口切片（WS）。

窗户翘曲（WW）

我们使用的最后一种数据增强技术是特定于时间序列的。如图2所示，它包括通过向上或向下加速时间序列中随机选择的片段来变形。原始片段的大小是此方法的参数。图2显示了来自“ ECG200”数据集和相应转换数据的时间序列。请注意，此方法会生成不同长度的输入时间序列。为了解决这个问题，我们对转换后的时间序列执行窗口切片，以使所有人的长度相等。在本文中，我们仅考虑翘曲比等于0.5或2，但是可以使用其他比率，甚至可以通过对训练集进行交叉验证对最佳比率进行微调。在下文中，该方法将被称为窗口变形（WW）。

纸上的图2

作者保持了90％的系列不变（即WS被设置为90％的切片，而WW则将系列的10％扭曲了）。据报道，这些方法可减少几种类型的（时间）序列数据的分类错误，但图像轮廓的一维表示除外。作者从这里获取数据：http：//timeseriesclassification.com

如何对训练集中的综合数据加权？

在图像增强中，由于不能期望增强会改变图像的类别，因此将其加权为任何实际数据是很常见的。时间序列预测（甚至时间序列分类）可能会有所不同：

时间序列作为人类的连续对象是不容易感知的，因此根据您对其进行的篡改程度，它仍然是同一类吗？如果您只进行切片和扭曲并且类在视觉上是不同的，则这可能不会对分类任务造成问题
对于预测，我认为

2.1 WS仍然是一种不错的方法。无论您看的是该系列中90％的部分，您仍然会期望基于相同规则=>全权重进行预测。

2.2 WW：系列赛结束时越接近，我就会越谨慎。凭直觉，假设曲线的最新特征最为相关，则权重因子将在0（最后弯曲）和1（开始弯曲）之间滑动。

— 编剧
source

6

还有其他想法可以对时间序列进行数据增强吗？

基于DeVries和Taylor的“特征空间中的数据集增强”，使用不同方法的另一个答案。

在这项工作中，我们证明了在特征空间中的样本之间进行推断可以用来扩充数据集并改善监督学习算法的性能。我们的方法的主要好处是它是领域无关的，不需要专门知识，因此可以应用于许多不同类型的问题。

听起来对我很有前途。原则上，您可以使用任何自动编码器在要素空间中创建表示。这些特征可以内插或外推。

$C_j$ $C_k$ $C'$

本文再次仅涉及序列分类。但是同样，IMO回归分析的原理是相同的。您可能想要从与实际数据相同的分布中获取新数据。

AE增强架构

如果进一步详细说明通过神经网络进行数据生成的原理，那么我们将得出生成对抗网络（GAN）。它们可以类似的方式用于生成增强数据，这可能是最复杂的最新技术。

— 编剧
source

4

我最近从Bergmeir，Hyndman和Benitez的论文中得到了启发，实现了另一种方法。

$B$ $B$

这样，可以生成足够多的附加时间序列，这些时间序列很好地表示了初始时间序列。这是在一些真实数据上应用程序的示例，以生成其他类似的时间序列：

此处使用Yeo-johnson变换而不是原始论文中建议的Box Cox来显示增强。

— 埃西尔
source