信息处理 - 识别音频信号中的声音 - 吾爱随笔录

我正在寻找识别音频文件中声音的方法。我希望找到一些现成的用户友好的软件来做到这一点，但还没有找到。我熟悉 Matlab 和一些 C++ 并且有 mech。英。背景，所以我可以自己做一些编码工作来实现解决方案，但我不是一个认真的程序员。

从我的在线搜索中，我似乎发现有两种可能的方法；互相关和指纹。在我看来，音频指纹识别方法可能比原始互相关更准确。在这一点上，这个调查是出于我自己的爱好目的，用机器人来实现。

有相关经验的人可以评论哪种方法可能更成功吗？似乎有几种音频指纹识别方法和一些开源代码，即使是对于 matlab，所以我很感兴趣，但是，这些方法主要是为了识别整首歌曲而开发的。

我想识别的声音很短（从 < 1s 到 ~5s）。我在想如果增加分析采样率以填充短声音文件，那么该方法可能适用于非常短的文件，例如这些声音，但我不知道对其他指纹技术的影响。这对任何人来说似乎都是一种合理/可能的方法吗？如果没有，我可以研究其他可能适用的 DSP 技术的参考资料吗？

谢谢。