声学房间模拟 - 克雷文假设

信息处理 声音 声学 心理声学
2022-02-13 21:05:39

我正在阅读 Udo Zölzer 的“数字音频信号处理”,其中有一篇关于声学房间模拟的文章。

这个问题更多是关于数学和声学的,但我假设任何使用声音进行 DSP 的人都知道这个主题。

我试图理解有关在 Gerzon 算法中使用的 Craven 假设(conering human's sound source distance evaluation)的摘录。

它看起来像这样:

书中的摘录

我的理解:克雷文试图说,当我们用耳朵感知信号时,我们可以很容易地评估两件事:

  • 直达信号与第一次反射的时间差
  • 它们的幅度之比

然后,他说,我们的大脑会评估这两者,并可以(或多或少地)确定声源的距离。

我不明白g的意思。据说,g代表直接信号与第一次反射的相对幅度。

不应该是另一种方式吗?我的意思是,它不应该代表“第一反射与直接信号的相对幅度”吗?如果我们假设两个源的 SPL 相同,则距离更近的源提供的信号比靠近接收器的源提供的信号更弱。

如果我只知道g的口头描述,我希望它总是大于 1,因为直接信号总是比任何反射信号响亮。

但是 g = SPL/SPL' = d/d' 是怎么发生的呢?

在此处输入图像描述

根据声音的平方反比定律,如果我们使用 SPL,距离 r 处的声压级:

SPL(r) = (SPL@source)/r

因此,如果g代表“直接信号与第一次反射的相对幅度”,我将计算:

g = SPL/SPL' = (P/d) / (P/d') = d'/d

SPL是接收器直接声音的声压级, SPL'是接收器第一次反射的 SPL,P是声源的 SPL,dd'是与声源的距离。

问题1 .:我的解释或书中的描述是否有错误?

问题2:经过所有的计算,当我们有了克雷文所说的d公式时,我们的大脑可以评估声源的距离,大脑从哪里获取声速来计算它?应该训练吗?

1个回答

问题1:方程(6.7)、(6.8)和(6.9)都是一致的,所以我建议定义的措辞g书中不正确。

问题 2:大脑只听到时差,并且根据经验,可以弄清楚它在距离方面的含义。所以大脑已经有效地“校准”了空气中通常的声速。我发现在水下(声速大约快五倍)听到声音会让事情看起来更接近。