我正在寻找音频信号处理的好工具。例如语音和音乐分析、自动语言识别等。
Scipy 库是否提供音频处理功能?它有一个很好的音频信号处理工具吗?
你能推荐一个工具吗?
我正在寻找音频信号处理的好工具。例如语音和音乐分析、自动语言识别等。
Scipy 库是否提供音频处理功能?它有一个很好的音频信号处理工具吗?
你能推荐一个工具吗?
就我个人而言,我发现 Python 是最好的选择之一,并且我自己在音频识别领域做了一些工作。欢迎您查看我的软件,例如从嘈杂的录音中自动识别鸟类:Ornithokrites。该程序由新西兰自然保护部使用,他们对此感到高兴。基于这个例子,我想指出使用 Python 的几个优点:
我的第二个选择是 R。虽然没有 Python 那样丰富的功能,但它有大量有用的库(例如,查看应用程序的seewave )。在 Windows 和 Linux 上安装它们是小菜一碟,如果您希望其他人使用您的程序,这一点很重要。但是,根据我的经验,R 中的高性能计算更加困难 - 如果您需要进行大量处理和识别,请注意这一点。
Python中的音乐分类示例:
Book Building Machine Learning Systems with Python有一章是关于音乐分类的
其他工具(列表并不完整):音乐中的 Python
似乎 Python 是一种流行的语言,它有一些很好的工具集,基于这样一个事实……我已经看到它在一些音乐技术研究生部门和公司中使用。
在学术界,在 Matlab 中完成此类工作非常常见,因为它在一个易于探测的 IDE 中汇集了许多强大的工具包(信号处理、并行计算、绘图、数据库实用程序、机器学习、人工智能)。然而,它要花钱并且有一些缺点(就应用程序设计和性能而言,它不是最好的编程语言,所以它主要是一个原型设计工具,但可以编译成 C 语言)。Octave 是免费的替代品,但我无法保证信号处理工具或软件本身的质量,因为我没有使用过它。
您还可以检查pyAudioAnalysis:它结合了用于模式识别的开放库和几个音频功能实现。在pyAudioAnalysis中实现的一些示例应用程序,您可能会觉得有趣:
您可以使用包含 python 绑定的Essentia音频分析 C++ 库。您将充分利用 python/scipy 环境以及 Essentia 附带的大量音频/音乐分析算法的所有优势。