您如何根据未来的特征与预测的不同来调整预测?

数据挖掘 机器学习 scikit-学习 时间序列 回归 预测建模
2022-02-26 17:28:14

我有一个模型,该模型主要采用累积数据并进行预测。这不是棒球,但我将其用作一个非常准确的类比。您输入到目前为止的所有总数,它可以预测目标未来的位置。

games_played|runs|runs_against|hits|hits_against|games_won
          20| 100|         120| 200|         240|       10

Expected games won after 5 more games: 12

我想做的是回答诸如“我们在 N 场比赛中预计会有多少次跑动?如果我们跑得比这多,那我们还能赢得多少场胜利?”之类的问题。

             |games_played|runs|runs_against|hits|hits_against|games_won
          now|          20| 100|         120| 200|         240|       10
    predicted|          25| 120|         150| 240|         300|       12
user_adjusted|          25| 130|         140| 260|         280|       13

我现在能想到的唯一方法是拥有多个模型,每个特征一个,然后将所有预测的特征放入另一个模型中。然后用户可以更新个别功能。这感觉像是工作量过大并且容易出错,但我可能完全错了。我不能只是线性地预测未来的特征,因为关系更复杂。

最适合此的算法/方法/工具是什么?我现在正在使用 scikit-learn。

1个回答

试试这两种方法:

第一的:

使用任何 ML 算法制作模型,并将您的数据分为训练和测试。现在使用之前的功能,检查训练和测试的准确性。

现在将新特征添加到之前的特征中,再次将数据分为训练和测试。检查训练和测试的准确性。

如果新功能有助于提高测试准确性,则仅使用它们,否则只需跳过它们。

第二:

将新特征添加到之前的数据集中,并将它们的值设置为 null/0。所以在预测之前的结果时不会受到它们的值的影响。稍后,当这些特征确实获得价值时,它们将有助于改进预测。

我希望这有帮助!