我目前正在为我的时间序列应用程序编写机器学习管道。在每个月底,我收集数据,对其进行归一化 ([0, 1]),仅使用新观察值重新训练 ML 模型并预测未来值。
问题
我是否应该在每次获得新的观察时读取整个数据集,标准化整个数据集,创建 ML 模型,然后进行预测?
我是如何陷入困境的:
- 假设我有 1 个特征,并且在t-1时所有值都有 min/max = [0, 1000]
- 在 t 处,一个新的观察值出现,值 = 1001
- 鉴于 ML 模型已使用不同的最小值/最大值进行训练,我应该如何规范化新值?
谢谢