语音的MFCC和说话人识别的区别

信息处理 matlab 声音的 语音识别 mfcc 语音处理
2022-02-02 14:38:58

我正在做我的说话人识别项目。我的一个朋友正在做他的语音识别项目。我们都需要计算 MFCC 来进行特征提取。

MFCC 对我们俩来说会是同一个吗?语音的 MFCC 算法和说话人识别的算法有什么区别吗?

2个回答

特点是一样的。您可能会遇到研究论文中报告的一些实现细节(窗口大小、mel 滤波器数量、提取系数的数量)的差异,但这些并不重要。

语音识别和说话人识别都需要一组特征来区分一个说话人(或语音部分)。

假设您有两个说话者 以及两个单词我们称为单词的说话者的话语。那么语音的 MFCC 是S1S2w1w2uijijM(uij)

提出说话人识别问题的一种方法是确定哪个说话人说出了新的话语假设话语是单词为此,我们只需选择扬声器,使得 unewJ

I=argminiuiJunew

这是如何工作的将取决于说话者之间的变化(即不同说话者说同一个词的 MFCC 有多少不同)。

提出语音识别问题的一种方法是选择: where的所有说话者的平均MFCC 。

J=argminju¯junew
u¯jj

其工作方式将取决于单词间的变化(即不同说话者所说的不同单词的 MFCC 有多少不同)。

所以,是的,两个应用程序的 MFCC 是(或可以是)相同的。