我正在寻找识别音频文件中声音的方法。我希望找到一些现成的用户友好的软件来做到这一点,但还没有找到。我熟悉 Matlab 和一些 C++ 并且有 mech。英。背景,所以我可以自己做一些编码工作来实现解决方案,但我不是一个认真的程序员。
从我的在线搜索中,我似乎发现有两种可能的方法;互相关和指纹。在我看来,音频指纹识别方法可能比原始互相关更准确。在这一点上,这个调查是出于我自己的爱好目的,用机器人来实现。
有相关经验的人可以评论哪种方法可能更成功吗?似乎有几种音频指纹识别方法和一些开源代码,即使是对于 matlab,所以我很感兴趣,但是,这些方法主要是为了识别整首歌曲而开发的。
我想识别的声音很短(从 < 1s 到 ~5s)。我在想如果增加分析采样率以填充短声音文件,那么该方法可能适用于非常短的文件,例如这些声音,但我不知道对其他指纹技术的影响。这对任何人来说似乎都是一种合理/可能的方法吗?如果没有,我可以研究其他可能适用的 DSP 技术的参考资料吗?
谢谢。