我正在运行自己的声音模拟器。现在我通过物理模拟得到了能量时间曲线(ETC,以能量表示),它们分别存储在8个离散的频带中(因为声音在空气中的衰减取决于声音的频率)。现在我在获取被测系统的脉冲响应(IR,以幅度表示)时遇到问题。我将需要 IR 与一些音频文件进行卷积。
所以我有,其中。并且长度足以捕捉 48kHz 采样率下的能量衰减。我应该如何从上述?
提前致谢。
我正在运行自己的声音模拟器。现在我通过物理模拟得到了能量时间曲线(ETC,以能量表示),它们分别存储在8个离散的频带中(因为声音在空气中的衰减取决于声音的频率)。现在我在获取被测系统的脉冲响应(IR,以幅度表示)时遇到问题。我将需要 IR 与一些音频文件进行卷积。
所以我有,其中。并且长度足以捕捉 48kHz 采样率下的能量衰减。我应该如何从上述?
提前致谢。
您无法真正从 ETC 获得脉冲响应。这是因为ETC代表信号的能量,而脉冲响应也包含时间信息。
有人可能会争辩说,ETC 也有一些时间信息,但并不相同。您需要相位才能重建脉冲响应,而这在 ETC 中根本不存在。
您可能尝试做的是将频带的能量相加以获得总能量(宽带),计算结果的平方根以获得幅度并添加随机相位,甚至施加您想要的相位特性。请记住,这可能会导致您的时间序列 (IR) 中出现不稳定的结果或复杂的值。
为了施加所需的相位响应,您可以将信号(总能量的平方根)与具有恒定幅度谱和所需相位的“制造”信号的 IFFT 进行卷积。
再一次请记住,任意相位曲线可能会导致“没有意义”的结果。无论如何,产生的声音可能听起来自然/真实,也可能不自然。很可能(虽然还没有测试过)其中的一部分,例如后期的混响故事可能听起来很自然(它表现出类似随机的相位特征),而 IR 的第一部分可能听起来并不令人信服。
制造阶段的主要问题是真实空间表现出混合阶段的特征。IR(早期反射)的某些部分具有最小相位(最常见),而后期混响则显示最大相位特征。