我目前正在研究输入音频信号的绝对频谱图。我正在使用非负矩阵分解来分离文件的节奏组件(低音鼓、小鼓和踩镲),并围绕这些组件的激活移动以获得修改后的频谱图。
现在,我想重建这个修改后的频谱图的相位,以便我可以进行逆 FFT 并在时域中重新创建音频信号。我目前正在使用此阶段检索工具箱中的 Griffin Lim 和 Phase Gradient Heap Integration 方法。不幸的是,这不会产生好的结果。也许与我正在使用的论点有关。我目前使用的窗口大小为 2048,跳数为 512。
1 , 2 - 这些问题之前发布过,解决了从绝对频谱图重建音频的想法。这个问题与在时域中重建音频信号的能力有关,以及当谐波含量相同但瞬态会时移时,最好的方法是什么。另外,您将如何客观或主观地正式评估这样的系统?
谢谢!