这与体育预测(板球)有关。我是机器学习的新手,并通过 TensorFlow 学习它。
我只关注一个主题,即“Player A
今天的比赛将得分多少?”
我的原始数据包括所有板球运动员在所有比赛中的得分。它还包括更精细的细节,例如比赛发生的场地、昼夜比赛、对手球队等,我需要使用这些数据并预测球员得分的四个可能范围,所有 4 个范围具有相等的概率。
我打算从 4 个简单FeatureColumn
的开始:
- 给定球员在过去 10 场比赛中的平均跑动次数(相对于正在训练的比赛)
- 击球顺序(1到10)(正在训练的比赛中)
- 自首次亮相以来的平均跑步次数(相对于正在训练的比赛)
- 平均数 过去 10 场比赛中面对的球数(相对于正在训练的比赛)
我的实际输出将是该球员在正在训练的比赛中的得分。
我可以考虑一名球员最近的 100 场比赛来进行这项训练。
来自 TensorFlow 的本教程https://www.tensorflow.org/tutorials/wide似乎与我正在接近的内容相匹配。但最终的输出是一个二进制值(无论薪水是否>50K)。但是我需要生成具有给定玩家运行概率的输出。例如。
Run | Probability of getting this run
-----------------------------------------
0 runs : 0.01
1 run : 0.01
2 runs : 0.02
....
13 runs : 0.5
14 runs : 0.04
....
56 runs : 0.08
57 runs : 0.03
....
概率之和应加起来为 1。然后我将所有这些值分组为 4 个范围,每个范围具有相等的概率(每个范围为 0.25),如下所示:
我可以使用哪种方法来解决这个问题?我阅读了线性回归,这似乎最适合我,但我不清楚如何生成所有可能结果的概率。