用于音频处理/分析的 OpenCV 类比库

信息处理 图像处理 声音的
2022-01-12 21:02:32

我知道 OpenCV 是用 C/C++ 编程图像处理的事实上的库;我想知道是否有用于音频处理的 C 或 C++ 库。我基本上想过滤来自麦克风的原始波,并用一些机器学习算法对其进行分析。但我最终可能还需要:

  • 多平台音频捕获和音频播放
  • DSP - 音频滤波器
  • 音调检测
  • 色调特性分析
  • 音调合成
  • 给定一些识别语料库和模型的识别
  • 语音/音乐合成

任何意见,将不胜感激。

4个回答

考虑以下:

蛤-project.org

CLAM(C++ 音频和音乐库)是一个成熟的软件框架,用于音频和音乐领域的研究和应用程序开发。它提供了一个概念模型以及用于分析、合成和处理音频信号的工具。

马尔夫

MARF 是一个开源研究平台,是用 Java 编写的语音/声音/语音/文本和自然语言处理 (NLP) 算法的集合,并安排在一个模块化和可扩展的框架中,便于添加新算法。MARF 可以在网络上分布式运行,并且可以作为应用程序中的库或用作学习和扩展的来源。

奥比奥

aubio 是一种用于从音频信号中提取注释的工具。它的功能包括在每次攻击之前对声音文件进行分段、执行音高检测、敲击节拍以及从现场音频中生成 MIDI 流。

如果您喜欢音乐信息检索,您绝对应该查看:

马西亚斯

您可能想查看普林斯顿声音实验室提供的不同代码库,例如STK(cufmo 提到的 MARSYAS 只是他们的项目之一)。您可以通过组合那里不同库的相关功能来实现项目的目标。

这些可能处于不同的级别,但值得一看 > http://the.echonest.com/http://vamp-plugins.org/