STFT 矩阵的低秩近似:好的音频压缩技术?

信息处理 fft 声音的 stft 压缩
2022-02-12 06:27:12

我最近听说了这个有趣的数学工具:

  1. 有一个矩阵A, 计算SVD (A=UΣtV因式分解,其中Σ是一个包含“奇异值”的对角矩阵)
  2. 保持k仅最大奇异值并丢弃最低值(将它们设置为0); 这给了Σ~.
  3. 然后A~=UΣ~tV将是最好的排名-kA的近似值。

步骤#2 可以节省大量存储空间,因此可以将其视为一种压缩技术。请参阅有关图像处理的此示例。


然后我想在 STFT 上试试这个。我做了:

Audio sound ---> STFT ---> low-rank-approximation of the STFT matrix thanks to SVD ---> iSTFT

好处是它有助于节省存储大小,压缩!不好的是它只会导致高频丢失

原始 STFT(收听音频文件):

在此处输入图像描述

经过低秩近似 STFT(高频或多或少丢失)(听音频文件):

在此处输入图像描述

有没有办法将这种“STFT 的低阶近似”变成更好的东西?如果不是,为什么?

0个回答
没有发现任何回复~