如何组合具有相似分布的数据?

数据挖掘 机器学习 时间序列 rnn 预测 分配
2022-03-07 21:45:36

我收集了大约 2 年的每日数据点的时间序列数据。我正在考虑一种增加其中数据点数量的方法,以便神经网络更好地了解数据的波动。我提出了一个假设,即我尝试按照相似的分布对相似的时间序列数据进行聚类,以增加输入神经网络的数据点的数量。这是解决问题的正确方法吗?如果是这样,我在什么基础上将这些相似的数据组合在一起,以便我可以将其输入神经网络/模型?

1个回答

将值分组在一起通常称为量化或分箱。分箱增加了数据的信噪比。

通常,时间序列数据按时间分箱(也称为汇总)。例如,将某一天范围内的所有值汇总为一个月份值。