假设我们有数百个数字,例如 (1, 2, 5, 8, 7, 15, 19, 8, 4, 6, ...),例如,这些数字是股票连续几天的收盘价。我想知道哪些算法可以很好地预测下一个数字?是否有可能找到这个数字序列之间的关系,或者我们需要额外的输入数据来进行预测?
我对此完全陌生,并为数据科学领域的新人寻求一些想法和指导(尽管我在机器学习以及图像和语音识别方面有一些经验)。
假设我们有数百个数字,例如 (1, 2, 5, 8, 7, 15, 19, 8, 4, 6, ...),例如,这些数字是股票连续几天的收盘价。我想知道哪些算法可以很好地预测下一个数字?是否有可能找到这个数字序列之间的关系,或者我们需要额外的输入数据来进行预测?
我对此完全陌生,并为数据科学领域的新人寻求一些想法和指导(尽管我在机器学习以及图像和语音识别方面有一些经验)。
嗨,这可以作为时间序列回归问题来处理。深度学习(Tensorflow 或 Keras 等更高级别的 API 工具)在这方面可能非常有效。这取决于许多因素,例如数据的数量和质量、架构、问题的复杂性以及超参数是否对您有用。machinelearningmastery.com有很多 LSTM 的例子,看看吧!也许从这个开始。正如您在2中的示例中看到的那样,您提到的数字和它们出现的顺序可能足以预测下一个数字。通常向您的神经网络添加更多信息应该可以改善它。
什么是时间序列
时间序列是按时间顺序索引(或列出或绘制)的一系列数据点。最常见的是,时间序列是在连续的等间隔时间点采取的序列。因此,它是一系列离散时间数据。时间序列的示例包括海潮高度、太阳黑子数量和道琼斯工业平均指数的每日收盘价。
时间序列分析
时间序列分析有两个主要目标:
这是您正在寻找的主题的第一步。