比较两条路径的最有效算法

信息处理 语音识别 mfcc 维特双算法
2022-02-19 08:50:32

我正在使用连续隐马尔可夫模型,并使用为给定序列找到最佳路径的维特比解码器。这是我的算法的工作原理:

1) Process the (input) .wav speech signal
2) Extract the MFCC Coefficients (13) 
3) Use these values to train the HMM
4) Execute the Viterbi Decoder 

和一个示例输入,在第 4 步之后给出了最佳路径:

0 0 0 0 0 0 0 0 0 0 0 0 0 2 12 6 6 2 2 4 2 2 2 2 2 6 4 2 2 6 6 2 2 2 2 2 2 2 2 
8 4 4 2 4 2 2 2 2 6 2 2 4 2 6 2 2 2 2 2 6 2 10 2 6 4 2 2 4 2 2 2 2 2 4 4 2 2 2 
6 10 2 2 4 2 2 2 2 2 2 4 2 2 4 2 2 2 2 2 2 4 2 2 2 2 6 2 2 2 2 2 2 4 4 2 2 2 2 
2 2 2 2 2 2 2 2 4 2 12 2 6 2 2 2 2 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 2 1 2 2 2 2 2 2 2 6 2 2 6 2 2 2 
2 12 2 2 2 13 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 8 4 4 2 2 2 2 2 2 4 2 2 4 
2 6 2 6 6 12 2 2 4 2 12 4 2 2 2 10 4 2 6 8 8 2 2 2 2 12 4 2 2 12 6 2 2 2 8 2 4 
2 4 2 2 2 12 2 2 2 2 4 4 6 2 2 6 6 2 4 4 2 2 2 4 2 4 10 10 8 2 2 2 2 6 4 2 4 2 
2 2 2 4 2 2 4 2 2 8 2 2 2 2 2 2 8 2 6 2 4 2 10 8 4 2 2 8 2 2 4 4 2 2 8 4 2 6 8 
4 2 2 12 2 6 2 4 8 4 2 2 2 2 4 2 2 2 2 2 2 2 2 2 2 4 2 4 2 2 2 2 2 2 2 2 2 2 2 
8 2 2 2 2 4 2 2 2 2 8 2 2 4 4 2 2 2 6 2 4 2 2 2 12 2 2 2 2 4 2 12 2 2 2 2 2 2 
2 8 2 2 2 6 12 2 2 2 2 2 2 2 2

在上述步骤中,我找到了针对模型的每个训练数据 (MFCC) 的最佳路径。这在比较自己时给出了一个好的结果,如果我输入一个语音文件“是”作为输入,那么“是”的训练将显示一个非常相似的路径,而如果我输入“是”作为输入并且与“否”的培训相比,最佳路径将有所不同。

我的问题是这样的:哪个会给我比较维特比路径的最有效方法?我只研究了欧几里得距离算法,以及汉明距离,所以更喜欢使用这些。我知道这是一个非常主观的问题,但是,我问的是能够匹配两条可能的路径。

希望可以有人帮帮我。

0个回答
没有发现任何回复~