这是由于上一个问题Hidden Markov Models - Distinct Observation Symbols和@pichenettes 的后续回答而想到的一个问题。
语音识别的一种方法是使用隐马尔可夫模型 (HMM) 来识别语音中的模式。离散 HMM 模型和连续 HMM 模型都已使用,但连续 HMM 方法似乎产生更好的结果。
在连续方法中,HMM 模型的“输入”是由处理后的语音帧构成的一系列向量。因此,在一定时间长度的块中处理语音会产生一些固定维度的向量,比如 N,N 的大小与帧长度直接相关。
我的问题是这样的:
帧长度(或者向量的维度,N)和导致用于识别的 HMM 模型的状态数之间是否存在关系?
预测语音所需的 HMM 模型的数量与 N 的大小之间是否存在关系?