信息处理 - 语音的MFCC和说话人识别的区别 - 吾爱随笔录

信息处理 matlab 声音的语音识别 mfcc 语音处理

2022-02-02 14:38:58

我正在做我的说话人识别项目。我的一个朋友正在做他的语音识别项目。我们都需要计算 MFCC 来进行特征提取。

MFCC 对我们俩来说会是同一个吗？语音的 MFCC 算法和说话人识别的算法有什么区别吗？

2个回答

特点是一样的。您可能会遇到研究论文中报告的一些实现细节（窗口大小、mel 滤波器数量、提取系数的数量）的差异，但这些并不重要。

语音识别和说话人识别都需要一组特征来区分一个说话人（或语音部分）。

假设您有两个说话者和以及两个单词和。我们称为单词的说话者的话语。那么语音的 MFCC 是。 $S_1$ $S_2$ $w_1$ $w_2$ $u_{ij}$ $i$ $j$ $M(u_{ij})$

提出说话人识别问题的一种方法是确定哪个说话人说出了新的话语。假设话语是单词。为此，我们只需选择扬声器，使得 $u_{\rm new}$ $J$

I = \arg min_{\forall i} ‖ u_{i J} - u_{n e w} ‖

$I = \arg\min_{\forall i} \lVert u_{iJ} - u_{\rm new}\rVert$

这是如何工作的将取决于说话者之间的变化（即不同说话者说同一个词的 MFCC 有多少不同）。

提出语音识别问题的一种方法是选择： where是的所有说话者的平均MFCC 。

J = \arg min_{\forall j} ‖ {\bar{u}}_{j} - u_{n e w} ‖

$J = \arg\min_{\forall j} \lVert \bar{u}_{j} - u_{\rm new} \rVert$

{\bar{u}}_{j}

$\bar{u}_{j}$

j

$j$

其工作方式将取决于单词间的变化（即不同说话者所说的不同单词的 MFCC 有多少不同）。

所以，是的，两个应用程序的 MFCC 是（或可以是）相同的。

其它你可能感兴趣的问题