我有一组时间序列二进制(布尔)数据,间隔为 1 天。每天可以是 1 或 0(真/假)。根据我已有的数据预测下一天/一周的数据的最佳方法是什么?
如何最好地预测简单的二进制数据?
数据挖掘
时间序列
初学者
分类数据
预报
2022-02-24 07:52:13
3个回答
我会认真考虑使用 bsts 包(在 R 中),将“logistic”作为模型系列。这将根据过去的趋势或周期性(取决于您构建模型的方式)为您提供 1 和 0 概率的预测。您还可以添加协变量,即以与您的 1/0 观察相关的方式发生变化的其他事物,以充当预测变量。
请参见本页上的图 9 和图 10:
http://www.unofficialgoogledatascience.com/2017/07/fitting-bayesian-structural-time-series.html
做一些特征工程。正如他们在评论中告诉您的那样,尝试查看该事件是否更有可能发生在周末或工作日、某些月份、某个季节或季度等。要阅读有关此主题的更多信息。
探索不同的机器学习模型。我建议从随机森林开始。
检查您的模型准确性(混淆矩阵)。
迭代。尝试其他功能,其他型号...
只是为了让您启动并运行,您可以查看 Kaggle 中的 Titanic 数据集。它将帮助您更多地了解您要解决的问题。
我建议您使用分类 HMM(隐马尔可夫模型)或 LSTM(长短期记忆)网络来预测时间序列的下一个值。
其它你可能感兴趣的问题