我正在做我的说话人识别项目。我的一个朋友正在做他的语音识别项目。我们都需要计算 MFCC 来进行特征提取。
MFCC 对我们俩来说会是同一个吗?语音的 MFCC 算法和说话人识别的算法有什么区别吗?
我正在做我的说话人识别项目。我的一个朋友正在做他的语音识别项目。我们都需要计算 MFCC 来进行特征提取。
MFCC 对我们俩来说会是同一个吗?语音的 MFCC 算法和说话人识别的算法有什么区别吗?
特点是一样的。您可能会遇到研究论文中报告的一些实现细节(窗口大小、mel 滤波器数量、提取系数的数量)的差异,但这些并不重要。
语音识别和说话人识别都需要一组特征来区分一个说话人(或语音部分)。
假设您有两个说话者和 以及两个单词和。我们称为单词的说话者的话语。那么语音的 MFCC 是。
提出说话人识别问题的一种方法是确定哪个说话人说出了新的话语。假设话语是单词。为此,我们只需选择扬声器,使得
这是如何工作的将取决于说话者之间的变化(即不同说话者说同一个词的 MFCC 有多少不同)。
提出语音识别问题的一种方法是选择: where是的所有说话者的平均MFCC 。
其工作方式将取决于单词间的变化(即不同说话者所说的不同单词的 MFCC 有多少不同)。
所以,是的,两个应用程序的 MFCC 是(或可以是)相同的。