我环顾四周,一个有前途的方法是这样的:
https://github.com/mpralat/notesRecognizer
问题是:
似乎还不够好。人们应该能够阅读具有较低质量图像的音符。你可以在她身上看到:“坏”图像文件夹只是闪电的微小变化已经导致她的高分辨率图像出现问题。
其他人在这里,他们都使用高分辨率清晰图像:
https://github.com/suyalcinkaya/music-note-recognition
https://github.com/suyalcinkaya/music-note-recognition/blob/master/input_images/im2s.JPG?raw=true
https://github.com/nikolalsvk/note-play
https://github.com/nikolalsvk/note-play/blob/master/images/notes-1.png?raw=true
现在,如果您想拍摄一些曲调的照片并希望它们被识别,这是不令人满意的。
那么可以做些什么来实现一个好的解决方案呢?
我正在考虑把音符当作书面信件来对待。计算机可以很容易地学习带有阿拉伯符号的书写字符。不过我想知道,对于一个非阿拉伯语的人来说,这有多容易?例如在中文或日文中,几个字符组合成一个。这同样适用于音符,它们可以连接起来并形成一些稍微不同的东西,例如
或者:
与简单的注释相反,例如:
什么是尝试运气的好方法,成功地解释这些符号,即使是稍微低分辨率的图像或有点模糊的变形图像。我并不是说要从缩略图中读出 symfony。但不是最佳捕获。
任何主观的想法或评论都非常受欢迎