音频信号插值技术的当前状态

信息处理 声音的 采样
2021-12-25 06:53:33

三个问题:

  1. 客观地衡量音频插值质量的所有指标是什么?(但如果可能的话,也可以在心理声学方面)

  2. 根据这些指标,音频插值的当前最新技术是什么?

  3. 假设我要从虚拟乐器的一系列音符中以两种分辨率渲染两个文件,然后将一个文件的上采样与高频渲染版本进行比较,可以使用什么软件来客观地比较这些文件?- 理想情况下使用前面提到的指标

到目前为止,据我所知,这些重采样器提供了一些最好的质量

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

这些重采样器似乎存在的问题之一是振铃前和振铃后。

我应该注意到,关键的兴趣是信号重建(只要该术语有意义),因此上采样比下采样更多。

编辑:在这种情况下,插值时间效率无关紧要。

最好的问候,好奇的:-)

2个回答

关于您使用重采样器注意到的“问题”:

许多重采样算法使用线性相位低通滤波器多相位插值内核。与线性相位插值内核(具有相同的频率响应)相反,最小相位滤波器插值内核在重新采样到更高采样率期间会产生更少的预振铃,这可能客观地测量为不太准确,但可能是心理上的听起来对人类来说“更好”。

以下是关于创建最小相位滤波器以进行可能较少预振铃的过滤的说明:http: //www.music.columbia.edu/pipermail/music-dsp/2004-February/059372.html

此外,Remez (Parks-McClellan) 设计的低通滤波器可能在频域中具有明显的周期性纹波,这也可能在时域中产生预环脉冲。因此,对于重采样插值内核的低通滤波器设计(后者通常会导致更接近最小相位),您可能想要尝试使用加窗 Sinc 或经典模拟滤波器的派生。

对重采样算法进行了非常彻底的比较:http: //src.infinitewave.ca/

你可以看到他们在那里使用的测试。混叠是一个很大的问题,很容易通过正弦扫描的频谱图来可视化。还有高频响应——SRC除了允许它们引起混叠之外,还可以滚降高频。您可以使用脉冲响应图或相位响应图来可视化相位响应。