我正在做一个多变量回归问题,它预测生产系统中故障模式的频率。在这个问题中,我使用 XGBRF 进行回归作为我的 ML 模型。
这些是与实际数据相比,6 个月内向前预测的结果:
从超参数和其他数据集的实验来看,我的模型似乎总是会过度预测。(没有负面错误)
所以,我的观点是,只使用这个模型,然后直接减去一个数字(例如 1 或 2)来“改善”结果,这是一种有效的做法吗?例如,从上面的结果变成下面的这个:
我是机器学习建模世界和统计学的新手。也许这是一个基本的禁忌。但我想知道这种做法是否可以。请赐教。