信息处理 - 计算频谱图的方法在理论上有什么区别？ - 吾爱随笔录

信息处理声音的离散信号频谱频谱图

2022-02-10 03:13:08

我注意到，当将 DFT 的结果转换为实数时，通常以不同的方式计算音频信号的频谱图。有些人倾向于计算 $|k|$ 或者 $|k|^2$ 而其他人使用公式 $Re(k)^2 + Im(k)^2\ \$ 对于每个 DFT bin $k$ . 这些和应该被视为标准（如果有的话）之间的理论区别是什么？

2个回答

首先

a b s (z)^{2} = R e {z}^{2} + I m {z}^{2} = z * z^{^{^{'}}}

$abs(z)^{2}=Re \left \{ z \right \}^{2}+Im \left \{z \right \}^{2}=z*z^{^{'}}$

这些在数学上都是相同的，所以任何一个都可以。

这就留下了是否应该应用正方形的问题。在几乎所有情况下，原始信号都将表示“线性”量，例如电压、电流、力、压力、粒子速度、体积速度等。物理功率总是与这些的平方（或更精确的乘积）有关数量。因此，如果您对实际的体力（或能量或强度）感兴趣，那么您需要应用平方。这确实是音频信号的惯例。

[极客模式开启]：一个警告是，简单地对线性量进行平方会隐含地假设阻抗，这可能会产生误导。例如，如果您使用距离扬声器相当远的麦克风进行测量，则声强度（在该位置）确实与测量压力的平方成正比。由于粒子速度和压力不同相，因此靠近扬声器不再是这种情况。[极客模式关闭]

为了更好地近似人类对简化数学公式中输入数据的感知响应（参见韦伯-费希纳定律），频谱图通常会显示 DFT 幅度的对数。因此，在获取 log() 后，将幅度平方或不消失在图形缩放或亮度/着色增益中。

因此，根本没有区别（不考虑任意缩放）。

其它你可能感兴趣的问题