每个人都使用快速傅里叶变换,它速度很快,但有损精度。输入音频具有采样精度,FFT 具有 1/64 采样精度。
什么算法可以输出对单个样本变化的音频的高分辨率频率分析,并且可以将输入音频划分为 1024 个不同频率的正弦频带,1024 个轨道中的每一个都是 22k 采样率?
每个人都使用快速傅里叶变换,它速度很快,但有损精度。输入音频具有采样精度,FFT 具有 1/64 采样精度。
什么算法可以输出对单个样本变化的音频的高分辨率频率分析,并且可以将输入音频划分为 1024 个不同频率的正弦频带,1024 个轨道中的每一个都是 22k 采样率?
使用 FFT 不会损失时间精度,因为 FFT 速度很快。FFT 只是一种用于实现离散傅里叶变换 (DFT)的快速算法,仅此而已。相反,由于海森堡不确定性原理,时间和频率分辨率存在固有的折衷。虽然它的陈述明确关注量子力学,但同样的基本原理仍然适用:你对信号频率的了解越准确,你就越不能及时定位它。
话虽如此,还有一类称为双线性时频分布的技术适用于某些应用。一个例子是Wigner-Ville 分布。简而言之,这些技术可以同时提供时间和频率的高分辨率。然而,代价是其结果输出中存在虚假特征。但是,确实存在这些分布的修改版本,可以减少伪影的大小。
https://patents.google.com/patent/US20180238943A1/en
Zynaptiq 有一个,也许从专利中你可以看到他们是如何做到的。
(对不起,旧线程,但这是专利中的有趣信息!)