我正在寻找用于数据科学目的的相对大量的爵士乐(和其他)独奏 - 可能多达 100 个 transctipts。虽然数量不多,而且有很多 pdf 成绩单可用,但我希望数据采用一种格式,以便我可以轻松访问 Python 中的所有信息(播放了哪个音符以及以什么节拍播放)。然而,手动编写所有这些数据将非常乏味且耗时。
因此我的问题是:有没有人知道任何软件可以自动读取 pdf 成绩单并将其放入不同的文件格式,或者是否知道一个网站的成绩单已经采用了一种我可以从 Python 轻松访问所有数据的格式?
我正在寻找用于数据科学目的的相对大量的爵士乐(和其他)独奏 - 可能多达 100 个 transctipts。虽然数量不多,而且有很多 pdf 成绩单可用,但我希望数据采用一种格式,以便我可以轻松访问 Python 中的所有信息(播放了哪个音符以及以什么节拍播放)。然而,手动编写所有这些数据将非常乏味且耗时。
因此我的问题是:有没有人知道任何软件可以自动读取 pdf 成绩单并将其放入不同的文件格式,或者是否知道一个网站的成绩单已经采用了一种我可以从 Python 轻松访问所有数据的格式?