分析足球比赛:使用 DBSCAN 分析相似球员,使用 TRACLUS 分析相似轨迹

机器算法验证 聚类
2022-04-10 16:23:43

我正在尝试分析来自比赛中球员鞋子附近的传感器的数据集(http://www.orgs.ttu.edu/debs2013/index.php?goto=cfchallengedetails)。

我决定查看聚类以确定:

  1. 使用TRACLUS 聚类算法的比赛中球员的相似轨迹

  2. 类似的球员通过计算一些特征,如不成功的传球、不成功的传中、射门和铲球。我想使用 DBSCAN 对它们进行聚类。

  3. 更频繁地将球传给彼此的球员。我怎样才能对它们进行聚类?

我可以从这种类型的数据集中利用其他东西吗?我可以在第 2 点中使用任何其他特征吗?

1个回答

那里有 2 个问题(第 1 点不是问题)。所有答案都在下面。

Q1:如何将经常互相传球的球员聚集在一起?

在我看来,这是一个加载的任务,最好分为以下几部分:

  • 确定球员是否在传球。您必须查看通常与传球相关的感觉数据的分布。很多方法可以做到这一点。曾经奇特的方法可能是将这个经验收集的数据集复制到 3D 游戏中,您可以使用类似的传感器加载玩家。游戏的好处是您可以识别您希望预测的目标变量(即您知道他们是否在传球)。通过这种方式,您可以使用游戏将感官数据的分布与目标变量相关联,最终生成一组带标签的样本。最后,您应用域适应步骤,通过该步骤将您的 3D 游戏模型转换为域经验收集的数据集(因此您可以在那里运行它,并且比没有域适应步骤的错误更少)。
  • 确定球员是否在接球。类似于上面的点,但在收到球时分配感官数据。
  • 识别链接的传球和接球。这是相对微不足道的:如果在传球后发生接球,则两名球员将球传给对方。为了减少噪音,您可能希望为此假设添加额外的约束,以确保将意外通过与有意通过区分开来。

Q2:我可以从这种类型的数据集中利用其他东西吗?(以便您扩展第 2 点)

  • 疲劳/耐力/速度作为活动和时间的函数。通过查看传感器位置/速度如何变化的频率速度,这可能很容易估计。
  • 一旦确定了上述要点,您就可以估计其他参数,例如恢复时间。
  • 此外,将以上所有内容与球员与球队的关系联系起来。例如,球员在疲倦时会更频繁地传球吗?当他疲倦时,他倾向于将球传给哪些球员或哪个方向?当他恢复体力时,他会改变传球目标/方向吗?