我正在阅读 Udo Zölzer 的“数字音频信号处理”,其中有一篇关于声学房间模拟的文章。
这个问题更多是关于数学和声学的,但我假设任何使用声音进行 DSP 的人都知道这个主题。
我试图理解有关在 Gerzon 算法中使用的 Craven 假设(conering human's sound source distance evaluation)的摘录。
它看起来像这样:
我的理解:克雷文试图说,当我们用耳朵感知信号时,我们可以很容易地评估两件事:
- 直达信号与第一次反射的时间差
- 它们的幅度之比
然后,他说,我们的大脑会评估这两者,并可以(或多或少地)确定声源的距离。
我不明白g的意思。据说,g代表直接信号与第一次反射的相对幅度。
不应该是另一种方式吗?我的意思是,它不应该代表“第一反射与直接信号的相对幅度”吗?如果我们假设两个源的 SPL 相同,则距离更近的源提供的信号比靠近接收器的源提供的信号更弱。
如果我只知道g的口头描述,我希望它总是大于 1,因为直接信号总是比任何反射信号响亮。
但是 g = SPL/SPL' = d/d' 是怎么发生的呢?
根据声音的平方反比定律,如果我们使用 SPL,距离 r 处的声压级:
SPL(r) = (SPL@source)/r
因此,如果g代表“直接信号与第一次反射的相对幅度”,我将计算:
g = SPL/SPL' = (P/d) / (P/d') = d'/d
SPL是接收器直接声音的声压级, SPL'是接收器第一次反射的 SPL,P是声源的 SPL,d和d'是与声源的距离。
问题1 .:我的解释或书中的描述是否有错误?
问题2:经过所有的计算,当我们有了克雷文所说的d公式时,我们的大脑可以评估声源的距离,大脑从哪里获取声速来计算它?应该训练吗?