我注意到,当将 DFT 的结果转换为实数时,通常以不同的方式计算音频信号的频谱图。有些人倾向于计算或者而其他人使用公式对于每个 DFT bin. 这些和应该被视为标准(如果有的话)之间的理论区别是什么?
计算频谱图的方法在理论上有什么区别?
信息处理
声音的
离散信号
频谱
频谱图
2022-02-10 03:13:08
2个回答
首先
这些在数学上都是相同的,所以任何一个都可以。
这就留下了是否应该应用正方形的问题。在几乎所有情况下,原始信号都将表示“线性”量,例如电压、电流、力、压力、粒子速度、体积速度等。物理功率总是与这些的平方(或更精确的乘积)有关数量。因此,如果您对实际的体力(或能量或强度)感兴趣,那么您需要应用平方。这确实是音频信号的惯例。
[极客模式开启]:一个警告是,简单地对线性量进行平方会隐含地假设阻抗,这可能会产生误导。例如,如果您使用距离扬声器相当远的麦克风进行测量,则声强度(在该位置)确实与测量压力的平方成正比。由于粒子速度和压力不同相,因此靠近扬声器不再是这种情况。[极客模式关闭]
为了更好地近似人类对简化数学公式中输入数据的感知响应(参见韦伯-费希纳定律),频谱图通常会显示 DFT 幅度的对数。因此,在获取 log() 后,将幅度平方或不消失在图形缩放或亮度/着色增益中。
因此,根本没有区别(不考虑任意缩放)。
其它你可能感兴趣的问题