信息处理 - 来自 wav 文件的 MFCC 特征向量 - 吾爱随笔录 - 问答

来自 wav 文件的 MFCC 特征向量

信息处理声音的 mfcc 分类参考实现

2022-02-22 10:27:36

我正在尝试使用神经网络从音频文件中实现口语标识符。我需要为每个音频文件生成一个特征向量。

从我读到的从 .wav 音频文件中提取的最佳功能（出于我的目的）是 MFCC。

有谁知道做这种事情的 Python 代码？

1个回答

看看这两个 python 库，它们很容易从 WAV 文件中提供许多音频功能，包括 MFCC。

Librosa：MFCC 文档，github
Madmom：MFCC 文档，github

祝你好运！

其它你可能感兴趣的问题

上一篇实现连续小波变换下一篇图像修复和图像去噪有什么区别？