在支持向量回归的上下文中,您的数据是时间序列这一事实主要从方法论的角度来看 - 例如,您不能进行 k 折交叉验证,并且在运行回测时需要采取预防措施/模拟。
基本上,支持向量回归是一种判别回归技术,与任何其他判别回归技术非常相似。你给它一组输入向量和相关的响应,它适合一个模型来尝试预测给定新输入向量的响应。另一方面,内核 SVR 在学习步骤之前将许多转换中的一种应用于您的数据集。这允许它在数据集中拾取非线性趋势,这与线性回归不同。一个好的内核可能是高斯 RBF——它有一个可以调整的超参数,所以尝试几个值。然后,当您对正在发生的事情有所了解时,您可以尝试其他内核。
对于时间序列,导入步骤是确定您的“特征向量”将是什么;每个都称为“特征”,可以从当前或过去的数据中计算出来,每个(响应)都将是您试图预测的任何时间段内的未来变化。以一只股票为例。随着时间的推移,你有价格。也许您的特征是 a.) 200MA-30MA 价差和 b.) 20 天波动率,因此您计算每个时间点的每个以及,即(比方说)该股票下一周的回报. 因此,您的 SVR 学习如何根据当前 MA 价差和 20 天成交量预测下一周的回报。(这个策略行不通,所以不要xxiyixtyt
如果您阅读的论文太难,您可能不想尝试自己实现 SVM,因为它可能很复杂。IIRC 有一个用于 R 的“kernlab”包,其中包含一个包含许多内核的内核 SVM 实现,这样可以提供一种快速启动和运行的方法。