在考虑音高的概念时,需要牢记两个不同的领域或领域,即声学信号(在您的情况下,是由一组基于基频的谐波组成的复杂音调)和我们对该声学信号的感知。
假设您组合了两个复杂的音调信号,一个信号包括基波和一组谐波,另一个信号只有谐波的子集,没有基频。使用 100 Hz 基频,第一个信号的一组示例频率可能是 (100, 200, 300, 400, 500, 600;所有值以 Hz 为单位),而第二个信号的一组示例频率可能是 ( 400、500、600;所有值以赫兹为单位)。我已经为这些信号中的每一个生成了频谱图和指向 WAV 文件的链接。
第一个信号的频谱图如下所示。该信号具有六个频率的能量——基波和五个谐波。 此信号的 3 秒 WAV 文件。

第二个信号的频谱图如下所示。该信号仅在第一信号的四个谐波频率处具有能量。 此信号的 3 秒 WAV 文件。

当这些信号中的每一个单独呈现给听众时,基底膜 (BM) 中唯一被激发的区域是存在声能的区域。由于第一个信号包括 100 Hz 基频和所有谐波,它将在这些频率下对 BM 产生机械活动。第二个信号只会在构成其组成的频率上产生活动。
如果您仔细聆听这两个信号,它们听起来会很相似,但它们的声学色彩会略有不同,这就是所谓的音色。重要的是,100 Hz 基波在两个信号中都很明显。虽然我可以检测到第二个信号中的基频,但在第一个信号中基频更为明显,因为该信号中存在基频。音高受复杂音调的组成以及其他因素(例如聆听的强度)的影响。这些元素可能会在如何感知这两个信号方面发挥作用。 作为参考,这里是一个只有 100 Hz 基频的 3 秒 WAV 文件。
我们对这两个信号的感知以及我们在第二个信号中检测到的 100 Hz 基频(通常称为残留音高)是我们的听觉系统的功能,它超出了耳蜗的 BM。
有两类模型试图解释残差音高,即模式识别模型和时间模型。有关这些模型的信息,我建议特别推荐教科书“听力心理学导论”,第五版,BCJ Moore,Emerald,2008 年。另一本非常好的教科书是《心理声学、事实和模型》,第三版,H. Fastl 和 E. Zwicker,Springer,2007。
我希望这可以帮助你。
迈克尔。