浏览关于最喜欢的销售预测的著名 kaggle 比赛的笔记本。
一个难题是,在训练和测试数据拆分后,似乎y_train有两列包含 unit_sales 和 transactions,这两个列都在预测,并最终与基本事实进行比较。
但是为什么有人会将这两列传递给一个model.fit()调用,而不是开发两个模型来预测这些列呢?或者这就是sklearn内部无论如何,即一次fit调用训练两个模型?如果不是,对我来说似乎只有一个模型会给出次优结果,因为模型可能会在每个数据点的两个不同标签之间混淆,并且不知道在其权重更新中要瞄准哪个值。
如果我对场景有任何误解,请纠正我。