我不是在谈论 FFT,只是原始声波和它的 RMS。
谢谢
我不是在谈论 FFT,只是原始声波和它的 RMS。
谢谢
不
人类听觉的灵敏度非常依赖于频率,如果没有任何类型的频率加权,原始 RMS 估计将几乎毫无用处。
有一些标准的频率加权曲线,最流行的是“A”加权。请参阅https://en.wikipedia.org/wiki/A-weighting。灵敏度还取决于绝对水平,因此有多个加权曲线。
Sp 频率加权 RMS 是一个很好的起点,但它们通常忽略对时域行为的任何敏感性,如脉冲、瞬态、掩蔽等。有很好的模型可以预测实际感知响度,但它们往往相当复杂。
正如 Hilmar 所指出的,响度是一个与频率相关的心理声学指标(如果不是全部,也是大多数)。直接取自Pulkki 的书:
听觉阈值和疼痛阈值之间的声音随着“强度”或“音量”的增加而被感知。声音的这种主观特征称为响度。响度级的定义使得以 dB 为单位的 1-kHz 纯音的声压级与以 phon 为单位的响度级相同
有关更多信息,您可以查看上述参考书或维基百科或任何其他声学教科书(如果您打算阅读它们,我可以提出一些建议)。
同样,有一些响度感知模型。一个来自 Zwicker,它提取了一个表示随时间变化的响度的连续函数。您可以从Zwicker 的书或此处的模型评论(免费下载)中获取有关它的信息。我知道的另一个来自 Glasberg 和 Moore,它实际上计算了连续重叠帧的短期响度。它还“有点”模拟了相邻时间框架之间听觉系统的时间整合。您可以在这里查看这个(也可以免费下载)。
根据第一个参考文献(Pulkki),目前没有一个模型可以完全解释响度感知。在没有丰富经验的情况下,我认为这主要是指音频编解码器,其中必须对“任意”信号进行编码以产生一致的结果(到目前为止,我个人还没有设法体验到)。
因此,根据您的预期应用,上述模型可能不够,也可能不够。不过,从这里可以看出,响度太复杂了,无法仅用压力(或粒子速度)RMS 值来表征(或测量它)。