我正在尝试构建一个数据集以将 MLP 应用于预测财务回报。主要想法是,我想使用基本数据来预测未来的股票回报(提前 1 个月,但范围可能会有所不同,只是为了给出一个想法)。
我的数据集由 N 家公司的 n 个特征组成。主要问题是这些特征不是在同一时间点记录的,因此其中一些是每月时间序列,而另一些是每日时间序列。我试图了解解决此问题的一般方法,因为这是我的第一个 ML 应用程序。
如果我的特征是在这个意义上不同的时间序列数据,我该怎么办?我有很多出版物,但没有人深入了解数据集的组成方式(在训练/测试拆分之前)。有人可以推荐一些有用的资源吗?
编辑
假设我有不同数量的公司超过 10 年的月度数据,主要是因为其中一些不再存在,但这对于生存偏差问题很重要。
对于这N家公司中的每家,我都有n 个代表这些公司基本面的特征。我将能够回归每月回报,所以我试图解决一个监督学习问题。
我无法理解的是使用简单的多层感知器而不是更复杂的结构(如 RNN 甚至 LSTM)来解决问题的可行性。由于与我正在构建的项目相关的某些特定原因,我不想切换到这些更复杂的架构之一。
可能我错过了网络训练背后的推理。我应该如何向架构提供输入数据以执行反向传播和 GD?我唯一确定的是,我应该改变一个时间段的月度回报序列,以将问题重铸为监督问题。