我正在尝试使用过去的结果来预测足球比分。我的数据集只有主队、客队、主队进球数和客队每场比赛进球数。如何使用我的数据集上的有限数据来使用随机森林算法和朴素贝叶斯算法对此进行建模?
使用机器学习进行运动预测
数据挖掘
机器学习
预测建模
预言
2022-02-08 13:48:14
2个回答
您有两个分类特征(团队名称)和两个连续特征(进球数)。连续特征可能会保持在一个较低的值,因为足球通常不是高分比赛,因此不需要标准化。
您可能需要团队名称的虚拟变量,因为文本名称可能无法很好地作为大多数分类库的功能。为此任务研究sklearn Ordinal Encoder 。
查看可用的sklearn 分类算法并尝试实现其中的一些。
您的响应变量将是两个预测分数。一个在家,一个在外。或者您可以决定响应变量可能只是分数预期传播的一个“传播”特征。
史蒂文的回答是正确的,但在选择过去使用的数据时,它会让您做出具有挑战性的决定。最近的数据比几年前的数据更能预测未来的比赛。
我更好的解决方案可能是使用类似于elo 评级系统的东西,它假设每个团队都有某种技能水平,这些水平因游戏而异。在每场比赛赢或输后,每支球队的 elo 等级都会根据赢家和输家进行更新。Nate Silver在他的体育预测中使用 elo 很受欢迎。
其它你可能感兴趣的问题