信息处理 - 音高感知 - 为什么我们的耳朵不能直接检测到丢失的基频？ - 吾爱随笔录

音高感知 - 为什么我们的耳朵不能直接检测到丢失的基频？

信息处理频率声音沥青基频人体检测

2022-02-01 06:08:47

我提出这个问题的动机与我们内耳的生物现象有关，所以我最初在生物社区发帖，但我怀疑答案有 DSP 解释，所以我认为这可能是一个更好的答案。

我现在正在学习音乐入门课程中的音高感知，并了解了缺少基本知识的情况。

在该维基百科页面的主图像中，似乎在底部图表中，去除了基频及其二次谐波，波在 100 Hz 处仍然非常周期性。既然Corti 器官有一些区域在有频率为 100 Hz 的声波时应该被激发，为什么这个在 100 Hz 时看起来呈周期性的声波不直接激发器官的那个区域？

（例如，不会每 0.01 秒就有一次高气压，这会使那个器官向某个方向摇摆，从而激发那个与那个频率的声音“共振”的区域吗？）

也许换一种说法：为什么顶部信号有一个频率为 100 的信号，而底部信号没有一个频率为 100 的部分？在我看来，底部信号也有一部分频率为 100 Hz。

2个回答

以下是它的大致工作原理。

一个典型的音符是由谐波和基音组成的。基波也是谐波之间的间距。
对于 100 Hz 基频，您将获得 100Hz、200Hz、300Hz、400Hz、500Hz 等。
对于 200 Hz，您将获得 200Hz、400Hz、600 Hz，这与 100Hz 相似但不一样。请注意，缺少 300Hz 和 500Hz。这里的间距是 200 Hz
在实践中，您很少能听到所有的和声，有些比其他的更响亮，有些则全部丢失，但是，您仍然可以轻松听到音高
那是因为您通过谐波的间距而不是最低音来确定音高。
例如，如果您通过添加 500、600、700 和 800Hz 来生成声音，您将听到对应于 100Hz 的音高，尽管信号中根本没有低于 500Hz 的频率。100 Hz 是周期性，不一定是频率内容。
皮质器官实际上进行了机械傅里叶变换。通过椭圆形窗口的激发在基底膜上产生弯曲波。由于膜的机械共振和一些通过传出神经和毛细胞控制的主动反馈机制，弯曲波中有一个很强的局部峰值，其位置与频率相对应
在上面的示例中，您会在 500、600、700 和 800 Hz 位置看到峰值，但在 100 Hz 时不会出现。信号中没有 100 Hz，因此在 100 Hz 位置没有激励。
实际的音高检测是通过识别信号的相关频谱部分并确定是否存在恒定间距来完成的。间距就是间距。我不知道我的头顶在外围发生了什么，但我猜它最像通过一些相关机制

在考虑音高的概念时，需要牢记两个不同的领域或领域，即声学信号（在您的情况下，是由一组基于基频的谐波组成的复杂音调）和我们对该声学信号的感知。

假设您组合了两个复杂的音调信号，一个信号包括基波和一组谐波，另一个信号只有谐波的子集，没有基频。使用 100 Hz 基频，第一个信号的一组示例频率可能是 (100, 200, 300, 400, 500, 600；所有值以 Hz 为单位)，而第二个信号的一组示例频率可能是 ( 400、500、600；所有值以赫兹为单位）。我已经为这些信号中的每一个生成了频谱图和指向 WAV 文件的链接。

第一个信号的频谱图如下所示。该信号具有六个频率的能量——基波和五个谐波。此信号的 3 秒 WAV 文件。

第二个信号的频谱图如下所示。该信号仅在第一信号的四个谐波频率处具有能量。此信号的 3 秒 WAV 文件。

当这些信号中的每一个单独呈现给听众时，基底膜 (BM) 中唯一被激发的区域是存在声能的区域。由于第一个信号包括 100 Hz 基频和所有谐波，它将在这些频率下对 BM 产生机械活动。第二个信号只会在构成其组成的频率上产生活动。

如果您仔细聆听这两个信号，它们听起来会很相似，但它们的声学色彩会略有不同，这就是所谓的音色。重要的是，100 Hz 基波在两个信号中都很明显。虽然我可以检测到第二个信号中的基频，但在第一个信号中基频更为明显，因为该信号中存在基频。音高受复杂音调的组成以及其他因素（例如聆听的强度）的影响。这些元素可能会在如何感知这两个信号方面发挥作用。作为参考，这里是一个只有 100 Hz 基频的 3 秒 WAV 文件。

我们对这两个信号的感知以及我们在第二个信号中检测到的 100 Hz 基频（通常称为残留音高）是我们的听觉系统的功能，它超出了耳蜗的 BM。

有两类模型试图解释残差音高，即模式识别模型和时间模型。有关这些模型的信息，我建议特别推荐教科书“听力心理学导论”，第五版，BCJ Moore，Emerald，2008 年。另一本非常好的教科书是《心理声学、事实和模型》，第三版，H. Fastl 和 E. Zwicker，Springer，2007。

我希望这可以帮助你。

迈克尔。

其它你可能感兴趣的问题

上一篇检测信号的谷值下一篇滤波器的相位函数