游戏 Rocksmith 和一些和弦吉他调音器(如PolyTune)至少在某种程度上能够识别单源音频中的多个基本频率。
我知道有一些用于多基频检测的方法,例如 MUSIC 和 ESPRIT,但这些产品是否有可能实现它们或利用有关应用程序的多个假设(例如:音频来自吉他,音频来自单一来源)域使更简单的方法起作用?
在第二种情况下,可能会使用哪些更简单的方法?使用特定领域的启发式方法在频谱上进行简单的取峰?或者更复杂的东西?
游戏 Rocksmith 和一些和弦吉他调音器(如PolyTune)至少在某种程度上能够识别单源音频中的多个基本频率。
我知道有一些用于多基频检测的方法,例如 MUSIC 和 ESPRIT,但这些产品是否有可能实现它们或利用有关应用程序的多个假设(例如:音频来自吉他,音频来自单一来源)域使更简单的方法起作用?
在第二种情况下,可能会使用哪些更简单的方法?使用特定领域的启发式方法在频谱上进行简单的取峰?或者更复杂的东西?
查看这篇关于多 F0 估计的IRCAM 论文的第 1.3 章。它讨论了从录音中提取多个 F0 的困难,包括重叠部分、瞬态和混响的处理,以及具有不同光谱特性的特定域源的建模。