在将这两个信号输出到我的模拟合成器之前,我希望实时哼唱到麦克风中并通过 dsp 产生我正在哼唱的包络和音高。这个合成器需要一个门和一个 cv 信号。
Control Voltage/Gate 是一种使用外部音序器控制合成器、鼓机和其他类似设备的模拟方法。控制电压通常控制音高,栅极信号控制音符开关(或 ASDR)。
我试图找出适合建立这两个信号的算法。我尝试使用滑动布莱克曼窗口和零填充。我应用 fft 来提取这些窗口的音高和响度。我使用的是 8kHz 的采样率,我在大约两个八度范围内哼唱旋律。
我想知道其他方法。我已经阅读了一些关于希尔伯特变换的内容,并注意到它用于查找窄带信号的包络。我是否正确地说我的声音不适合这种情况,因为它包含多个谐波?在应用 ifft 之前,我可以带通频谱(fft 窗口)中的基本谐波吗?一个音符的起音部分通常富含高次谐波,这又如何呢?如果可以选择带通滤波,我想我需要对此进行补偿。我可以使用希尔伯特方法吗?还有其他建议吗?