背景:我过去在 XY 位置(重合麦克风)进行了立体声录音:
距离至少 20 米的源(例如:大型混响建筑中的钢琴)。
由于麦克风是重合的,因此存在 IID(耳间强度差异),但遗憾的是,很少有 ITD(耳间时间差异)。因此,录音不那么生动,更不用说“在你的头脑之外”(用耳机听时),它可能是用一对间隔开的麦克风。这是我要解决的最后一个问题,因为我无法重做录音:将声音重新空间化为更接近间隔对录音的东西。(我还有其他带有一对间隔非重合麦克风的录音,我确认它会更好)。另请参阅重新空间化立体声录音音频信号的算法?.
(欢迎任何实现这一总体目标的编码想法)。
我现在考虑在这个问题中实现这个目标的选项是:
- 将信号
L[n]
,R[n]
(left, right) 分解成若干层 - 在每一层上应用不同的 ITD(Interaural Timing Differences)
- 混合层以获得新的输出信号
中侧示例:
Mid[n] = (L[n] + R[n]) / 2
Side[n] = (L[n] - R[n]) / 2
Out_L[n] = Mid[n] + Side[n + K1] # K1 is a time-shifting parameter
Out_R[n] = Mid[n] - Side[n + K2] # K2 is a time-shifting parameter
我试过这个,但它并没有真正帮助实现上述目标。
问题:是否存在超出 Mid (0°) + Side (90°) 的立体声信号分解?
就像是:
Layer1[n] = Mid (0° to 30°)
Layer2[n] = Diagonal (30° to 60°)
Layer3[n] = Side (60° to 90°)
注意:算法的这个答案的“重合麦克风”部分重新空间化立体声录音音频信号? 可能有用,但我不知道如何在应用算法中具体使用它。