数据挖掘 - 构建金融机器学习的数据集 - 吾爱随笔录

我正在尝试构建一个数据集以将 MLP 应用于预测财务回报。主要想法是，我想使用基本数据来预测未来的股票回报（提前 1 个月，但范围可能会有所不同，只是为了给出一个想法）。

我的数据集由 N 家公司的 n 个特征组成。主要问题是这些特征不是在同一时间点记录的，因此其中一些是每月时间序列，而另一些是每日时间序列。我试图了解解决此问题的一般方法，因为这是我的第一个 ML 应用程序。

如果我的特征是在这个意义上不同的时间序列数据，我该怎么办？我有很多出版物，但没有人深入了解数据集的组成方式（在训练/测试拆分之前）。有人可以推荐一些有用的资源吗？

编辑

假设我有不同数量的公司超过 10 年的月度数据，主要是因为其中一些不再存在，但这对于生存偏差问题很重要。

对于这N家公司中的每家，我都有n 个代表这些公司基本面的特征。我将能够回归每月回报，所以我试图解决一个监督学习问题。

我无法理解的是使用简单的多层感知器而不是更复杂的结构（如 RNN 甚至 LSTM）来解决问题的可行性。由于与我正在构建的项目相关的某些特定原因，我不想切换到这些更复杂的架构之一。

可能我错过了网络训练背后的推理。我应该如何向架构提供输入数据以执行反向传播和 GD？我唯一确定的是，我应该改变一个时间段的月度回报序列，以将问题重铸为监督问题。