我目前正在使用 FFT 实现语音识别算法,现在我遇到了一些问题:
- Spectral Leakage:我知道它是什么,为什么会出现以及如何使用 Windowing Function 解决它,但是对于这个问题还有其他解决方法吗?
- 阶段:我知道它是什么,但我可以在哪里使用它以及如何使用它?
- 获取实际幅度(我知道它与频谱泄漏有关,但我会单独问这个问题):假设我有一个频率分辨率为
250
(sampling rate = 32000 Hz
,frame size = 128
) 的频谱,并且我发送到 FFT 的输入是一个正弦函数其频率为567.5 Hz
(因此,周期数是非整数,导致频谱泄漏)。我的频谱会是这样的: 所以我的问题是:如何检索频率的原始幅度567.5 Hz
?