我试图在工业环境中预测一个连续的目标。
我面临的问题是一些预测因素随着时间的推移而变化,例如机器中的压力增加了。这影响了其他一些预测因素,但并未影响我的目标。
例如(在 R 公式表示法中):
目标取决于一些不可观察的变量 我观察到的变量之一取决于不可观察的变量和另一个观察到的变量。因此有助于预测
现在已经改变了几次。这显然没有影响我的目标。但我也不能真正学习关系因为已经改变了。
我从物理学中知道其中一些事实的依赖关系。但是我无法手动解决这个问题,因为大约有 1000 个变量。
在阅读数据漂移时,总是关于如何将现有模型调整为突然变化,但对我来说,这些变化已经发生在过去。
没有任何变化的时间段太小,不能只使用最新的批次,但似乎只使用整个数据集而不进行任何调整也不起作用。
任何人都可以就如何解决这个问题提供建议吗?
(现在我正在使用 XGBoost,但我对其他模型持开放态度)