在支持向量回归的背景下,从方法论的角度来看,您的数据是时间序列这一事实主要与之相关-例如,您无法进行k倍交叉验证,并且在进行回测时需要采取预防措施/模拟。
基本上,支持向量回归是一种判别回归技术,与任何其他判别回归技术一样。您给它提供了一组输入向量和相关的响应,并且它适合模型以尝试预测给定新输入向量的响应。另一方面,内核SVR在学习步骤之前将许多转换之一应用于您的数据集。与线性回归不同,这使它可以拾取数据集中的非线性趋势。一个好的内核可能是高斯RBF -它具有可以调整的超参数,因此请尝试几个值。然后,当您对正在发生的事情有所了解时,可以尝试其他内核。
对于时间序列,导入步骤正在确定您的“特征向量” 将是什么;每个x i都被称为“特征”,可以根据当前或过去的数据进行计算,每个y i(响应)将是您要尝试预测的一段时间内的未来变化。以股票为例。您的价格随时间推移而变化。也许你的特点是一个。)在200MA-30MA传播和b。)20日波幅,所以你计算每X ŧ在每个时间点,随着ÿ ŤXX一世ÿ一世XŤÿŤ,即该股票一周后的收益(例如)。因此,您的SVR学习如何根据当前的MA价差和20天交易量来预测下周的收益。(此策略无效,所以不要太兴奋;)。
如果您阅读的论文太难了,您可能不想自己尝试实现SVM,因为它可能很复杂。IIRC为R提供了一个“ kernlab”软件包,该软件包具有内核SVM实现,其中包括许多内核,因此可以提供一种快速启动和运行的方法。