这是我的第一次信号处理练习,所以我对这个领域很陌生。话虽如此,目标是在识别某人说“是”和“否”时隔离语音识别。正如标题所示,我有一个 1x26 向量,如下所示:
Columns 1 through 10
(P)160.2504 66.7557 -35.9298 144.1598 -11.9133 -16.2184 -26.4730 78.0673 10.2075 -39.4318
Columns 11 through 20
-46.6702 5.9283 -42.9540 (P)0.2614 0.0382 -1.3315 0.1326 -1.4256 0.1936 0.4081
Columns 21 through 26
-1.4431 -1.6916 -1.1668 -0.2901 -0.4499 -0.4309
其中 (P) 分别表示梅尔倒谱系数和 Delta 系数的对数能量。话虽这么说,我想知道如何规范化这些值,但如何?我不确定将能量除以什么,更不用说系数了。就像我说的第一个项目一样,非常感谢指导我的真正帖子!