大型金融时间序列的特征选择、机器学习和时间序列分析

数据挖掘 机器学习 算法 特征选择 特征提取 张量流
2022-02-16 07:05:50

我有 m( 大约 O(millions) ) 行类型

timestamp | val | ind1 | ind2 | ind3 | .... k entries 

我的任务是预测任何未来给定时间的“val”值。我应该如何将其建模为机器学习问题。请注意,在不知道当前值的情况下,我们希望在给定过去数据的情况下获得“val”的值

ind1 | ind2 | ind3 | .... etc.

同一行的。这在这个意义上是不同的。

正式地,假设我有表的前 i 行(每个条目都是已知的)。我想预测的值(j>i,即不久的将来)。我将如何做到这一点?我之前没有使用 ML 或 TensorFlow 进行过此类预测。如果我们得到等但不是这种预测本来很容易。valjind1j,ind2j,...valj

即使我将我的 val 建模为先前索引的 ind1、ind2 等的函数。我将如何在不同的未来时间获得它?

关于数据我对数据知之甚少。我所知道的是它与股票和交易所有关。也许“val”是依赖于 ind1、ind2 等的实体。除此之外,您假设任何合适的东西。

我有 m( 大约 O(millions) ) 行类型

timestamp | val | ind1 | ind2 | ind3 | .... k entries 

我的任务是预测任何未来给定时间的“val”值。我应该如何将其建模为机器学习问题。请注意,在不知道当前值的情况下,我们希望在给定过去数据的情况下获得“val”的值

ind1 | ind2 | ind3 | .... etc.

同一行的。这在这个意义上是不同的。

正式地,假设我有表的前 i 行(每个条目都是已知的)。我想预测的值(j>i,即不久的将来)。我将如何做到这一点?我之前没有使用 ML 或 TensorFlow 进行过此类预测。如果我们得到等但不是这种预测本来很容易。valjind1j,ind2j,...valj

即使我将我的 val 建模为先前索引的 ind1、ind2 等的函数。我将如何在不同的未来时间获得它?

关于数据我对数据知之甚少。我所知道的是它与股票和交易所有关。也许“val”是依赖于 ind1、ind2 等的实体。除此之外,您假设任何合适的东西。

请给出任何想法,随着新数据行的添加,系统将如何迭代学习。我不想一次又一次地进行整个培训。

1个回答

您的模型应该基于您的数据所代表的内容。如果您想要有意义的结果,您应该在尝试回答这个问题之前对您的数据所代表的内容有所了解。

例如,您可以使用ind # 列来预测ind #行的值,然后使用ind # s 来预测val但这只有在ind #之间存在预测关系时才有意义。您肯定想了解这种关系可能是什么,以便为每个特定列选择合适的算法。jjjj

此外,这同样适用于val预测。至少您希望对ind # s 和val列之间的关系做出有根据的猜测,以便选择合适的算法。 jthjjj

作为另一个示例,您可以将前一行用作时间序列中下一个值的预测器。ind # s => val但同样,这只有在您能够对数据关系做出合理假设时才有意义,因为您最终需要选择用于进行预测的算法。j1j