我正在从事语音识别研究,我想知道是否有一种方法可以像耳朵一样分析声音(即没有窗口),例如,通过更新每个新样本来连续获取一些特征。
类似于谈论重叠率99%的窗口或类似的东西,您可以看这样的问题:没有窗口概念的耳朵如何工作?
我正在从事语音识别研究,我想知道是否有一种方法可以像耳朵一样分析声音(即没有窗口),例如,通过更新每个新样本来连续获取一些特征。
类似于谈论重叠率99%的窗口或类似的东西,您可以看这样的问题:没有窗口概念的耳朵如何工作?
是的,可以像耳朵一样分析声音。
例如,您可以使用多个Goertzel 滤波器连续计算信号的 DFT 。
在哪里, 以便是直流或零频率项。
当然,这是一个不稳定的过滤器,所以需要一些重置或遗忘因素来保持它的稳定。有一些方法可以使它在数值上表现得更好(参见 Stoer & Bulirsch 的 pp84-93)。
我们通常不以这种方式做事的原因是我们通常试图以尽可能计算效率最高的方式来做。大自然并不一定会这样做,所以我们找到了做类似事情的方法,但在计算机上效果更好。