信息处理 - 声学房间模拟 - 克雷文假设 - 吾爱随笔录

我正在阅读 Udo Zölzer 的“数字音频信号处理”，其中有一篇关于声学房间模拟的文章。

这个问题更多是关于数学和声学的，但我假设任何使用声音进行 DSP 的人都知道这个主题。

我试图理解有关在 Gerzon 算法中使用的 Craven 假设（conering human's sound source distance evaluation）的摘录。

它看起来像这样：

我的理解：克雷文试图说，当我们用耳朵感知信号时，我们可以很容易地评估两件事：

然后，他说，我们的大脑会评估这两者，并可以（或多或少地）确定声源的距离。

我不明白g的意思。据说，g代表直接信号与第一次反射的相对幅度。

不应该是另一种方式吗？我的意思是，它不应该代表“第一反射与直接信号的相对幅度”吗？如果我们假设两个源的 SPL 相同，则距离更近的源提供的信号比靠近接收器的源提供的信号更弱。

如果我只知道g的口头描述，我希望它总是大于 1，因为直接信号总是比任何反射信号响亮。

但是 g = SPL/SPL' = d/d' 是怎么发生的呢？

根据声音的平方反比定律，如果我们使用 SPL，距离 r 处的声压级：

SPL(r) = (SPL@source)/r

因此，如果g代表“直接信号与第一次反射的相对幅度”，我将计算：

g = SPL/SPL' = (P/d) / (P/d') = d'/d

SPL是接收器直接声音的声压级， SPL'是接收器第一次反射的 SPL，P是声源的 SPL，d和d'是与声源的距离。

问题1 .：我的解释或书中的描述是否有错误？

问题2：经过所有的计算，当我们有了克雷文所说的d公式时，我们的大脑可以评估声源的距离，大脑从哪里获取声速来计算它？应该训练吗？