我正在尝试使用 FFT 方法构建歌曲可视化器。当我分析音频时,我得到了每个频率范围的值。
据我了解,
在范围内, 在哪里是最响亮的。
响度百分比的公式是.
然而我得到的值始终低于, IE,响度,即使在歌曲的响亮部分。为什么会这样?我是否错误地计算了响度?
另外,如何计算某个时间点的整体响度?它是所有值的总和,还是最大值?
我正在尝试使用 FFT 方法构建歌曲可视化器。当我分析音频时,我得到了每个频率范围的值。
据我了解,
在范围内, 在哪里是最响亮的。
响度百分比的公式是.
然而我得到的值始终低于, IE,响度,即使在歌曲的响亮部分。为什么会这样?我是否错误地计算了响度?
另外,如何计算某个时间点的整体响度?它是所有值的总和,还是最大值?
然而,我得到的 dbFS 值始终低于 -20,即 10% 的响度,即使在歌曲的响亮部分也是如此。为什么会这样?我是否错误地计算了响度?
为什么这会是个问题?人类的感知大致是对数的。不是“难以忍受的响亮”的声音不应超过“声学动态范围”的 10%。
顺便说一句,与,这个公式给你的是幅度,而不是功率值,所以这不是真正的响度,只是幅度。但由于这在感知上只是一个常数因素,因此这些术语可以互换使用。
另外,如何计算某个时间点的整体响度?它是所有值的总和,还是最大值?
这是总和,至少是近似的:人类感知对不同频率具有不同的灵敏度,而且频率可以相互掩盖,因此如果我们忽略这些事实,信号中的能量仅与感知响度成正比(参见:心理声学模型)。