假设我有一个模型可以预测商店中销售的冰淇淋数量的结果。
该模型在过去 5 年的数据上进行了训练,同时将去年作为验证集,并产生了非常好的结果。
我们现在将模型投入生产,以便首席财务官可以为来年的预算做出估算。首席财务官现在查看 5 月的预测,比如 2000 份冰淇淋,并认为“哦……我希望在 5 月份有更多销售。我会卖 4000 份”,因此他订购了更多广告,推出了新口味等. 并在 5 月底达到他所希望的 4000 份冰淇淋销量。
6 月 1 日,我们与首席财务官交谈,在前 6 个月后评估模型,我们看到我们在 5 月的预测偏离了 100%!
这种飙升可以用增加的广告等来解释,并且在其他所有日子里,该模型都做得很好,但是如果首席财务官每天都开始调整广告、口味等以达到预算,我们将如何能够测试,如果我们的模型在生产/现实世界中确实很好?以及我们将如何重新训练模型,因为前 5 年的销售没有任何“人为影响”,而在一年后,销售受到广告等的影响,因此 5 月的飙升不是“自然”,但由于一些我们无法纳入的外生变量(例如,我们不知道首席财务官的预算)?