我接受了一个项目来预测足球比赛的结果,但结果证明这是一项非常具有挑战性的任务。我尝试了不同的模型,但我的测试数据集的准确率只有 50-54%。一些模型的创建方式使得某个模型可以预测球队是否会赢、平或输一场比赛。同样的模型也可以预测该球队的对手是赢、平还是输。每个模型对每个团队的预测准确率约为 50%。我尝试的第二组模型结合了两支球队的数据,并预测了比赛属于哪个类别(主队获胜、客队获胜、平局)。在系统中,每天只给出 10 个匹配项进行预测。这意味着,如果我使用第二个模型预测 10 个匹配项,我就有机会正确预测 5 个。在这个项目中,我只需要在一天给出的 10 场比赛中正确预测 3 场比赛。是否有一个系统可以知道我的模型最有可能正确预测的 3 个匹配项?我只需要得到 3 个正确的预测,我通常会得到 5 个正确的预测,但我不知道如何选择我的 3 个最佳匹配。
注意:第一种模型使用大约 50 个特征进行预测,而第二种使用 101 个。我尝试过集成,它们仍然给我大约 50% 的准确度。我仍将建立一个系统来选择比赛,其中主队的预测与使用第一种模型的客队的预测不矛盾。