我是语音识别和深度学习的新手,并且处于学习阶段。
我正在尝试按照这篇论文学习如何在 HTK 环境中使用 RNN 作为后验概率估计。论文提出了RNN-HMM混合系统,所以对于HMM部分我需要使用HTK平台。
问题是我什至无法从任何地方开始。我有一个使用 HMM 识别数字的示例代码,但我无法解决我应该在哪个部分将 RNN 插入代码。
如果有任何想法,我会很高兴。
我在 python 环境中有代码,HMM 是使用 HTK 应用的。将数据转换为MFCC格式后,我应该使用RNN,但是在使用RNN之后,我应该应用HMM的哪些步骤来生成RNN-HMM声学系统。