首先,我道歉,因为我是一名软件开发人员,而且我已经很长时间没有深入研究纯数学了,所以我的问题可能看起来很愚蠢。我希望不是。
上下文是音乐中的音高识别。
如果你记下一个音符,并对其应用傅里叶变换,你将拥有给定频率的无限幅度和。例如,如果我弹奏一个基本音为,在任何仪器上,经过傅里叶变换后,我将在. 每个频率都有一个给定的幅度,它定义了乐器的音色(钢琴、人声、小号……都遵循这个规律,但是每个谐波都有不同的幅度)
现在我想做的是从给定的音频信号中,找到. 只是。它比看起来更复杂,因为你总是会有背景噪音等等......此外,不一定是振幅最高的频率!
所以我的想法是找到是应用DFT(实际上是速度的FFT)并找到一个频率, 以便在 FFT 输出中最大。
你认为这有可能吗?你认为这可能在很短的时间内(比如说 < 5 毫秒)吗?