然后,我希望我的模型返回具有以下信息的 2D 模型:
给出了球员在场上的位置;并且玩家的相对距离也得到了很好的保存。
这是我实现这一目标的计划:
首先,使用一些标准的 ML 算法进行玩家检测(大量资源可供研究)
然而,主要的挑战是,在给定输入图像的情况下,我如何计算出该玩家在 2D 模型中的对应位置?同时,非常重要的部分,让摄像机图像中的场部分在 2D 模型场中得到很好的表现(比例很好,可以很好地保持玩家之间的相对距离)
因为我的目的是基于转播视频对 2D 足球比赛进行建模(反映真实转播足球视频的 2D 模型。因此,广播摄像机的一系列事件可以从鸟瞰图建模为 2D)。广播视频正在从一侧移动到另一侧。(目前,我排除了录制观众的框架,或单人游戏的特写镜头)
输入图像中可用作参考的所有线条对于每一帧都不是固定的。很难确定玩家的位置。
(我正在寻找已发表的论文,以便我可以实现算法)