如何在修改后的音频绝对频谱图中“完美”重建瞬态相位?

信息处理 声音的 阶段 频谱图 重建
2022-02-11 02:01:00

我目前正在研究输入音频信号的绝对频谱图。我正在使用非负矩阵分解来分离文件的节奏组件(低音鼓、小鼓和踩镲),并围绕这些组件的激活移动以获得修改后的频谱图。

现在,我想重建这个修改后的频谱图的相位,以便我可以进行逆 FFT 并在时域中重新创建音频信号。我目前正在使用此阶段检索工具箱中的 Griffin Lim 和 Phase Gradient Heap Integration 方法。不幸的是,这不会产生好的结果。也许与我正在使用的论点有关。我目前使用的窗口大小为 2048,跳数为 512。

1 , 2 - 这些问题之前发布过,解决了从绝对频谱图重建音频的想法。这个问题与在时域中重建音频信号的能力有关,以及当谐波含量相同但瞬态会时移时,最好的方法是什么。另外,您将如何客观或主观地正式评估这样的系统?

谢谢!

1个回答

实时迭代频谱反演将是解决该问题的一种方法。看看这篇论文:

通过能量顺序和相位展开改进 RTISI 相位估计