我目前正在编写学校作业。我对某人的讲话进行了 1.5 秒的录音,其中混入了 4 个流氓余弦。采样率为 16000Hz,我将录音分为 1024 个样本的帧,其中 512 个样本重叠。
我选择了一个没有混入语音的帧,这样流氓余弦就不会受到说话者声音的影响。
这是离散傅立叶变换幅度的结果图(现在不需要相位部分):
在 0 到 8000Hz 的范围内,频率箱的大小为 16000/1024=15.625Hz,我能够确定这些频率。大约是 875、1750、2625、3500,每个单位为 Hz。
我的第一个问题是:垂直轴在 DFT 上代表什么?是的,它是量级,但它的真正含义是什么?这是否意味着频率为 875 Hz 的余弦波的幅度为 30?还是因为也有负频率,所以它是 60?
我们的下一个目标是过滤掉这些。好的,所以我构建了一个在这些频率处为零的滤波器(以及它们的负频率的共轭对)。这是它的传递函数的样子:
零的系数是:
奇异极点的系数为:
我认为这会破坏这四个频率,但是它破坏了高达约 12000Hz 的所有频率。
这是频率响应图:
总结一下,有两点我不明白:
DFT 中纵轴的含义及其与我要查找的余弦幅度的关系。
为什么过滤器几乎过滤掉了我信号中的所有内容。

