以视觉方式表示音频的最佳方式是什么?(来自 UX 的 x-post)

信息处理 声音的 频谱 频谱图
2022-01-27 14:43:20

原始问题:https ://ux.stackexchange.com/q/23040/16006

我只参加了一些基本的信号分析课程,所以我可能会遗漏一些东西。

纯理论问题:

有哪些表示音频的方法?

可以使用哪些方法来表示音频,更具体地说是音乐音频

到目前为止,我知道:

  • 查看波形(Soundcloud 这样做),除了看到“响度”之外,几乎没有用处

  • 频谱分析(示例),有利于查看频率和“响度”

本质上,我想知道是否有一种方法可以直观地“看到”一首歌的音符、节拍等。

就在我的脑海中,我可以想到随着时间的推移显示 3 个不同颜色的波,代表高音、中音、低音在类似声音云的容器中,播放(或鼠标悬停)的部分被放大,周围的波形被压缩成角落(如广角镜头效果)。

编辑:我不知道可以在哪里使用,这只是出于我对当前音频可视化技术的挫败感。

我想随着时间的推移进行频谱分析的 3d 图(忍者编辑:显然称为频谱图)将是“最佳”解决方案,因为您可以看到所有内容,但它可能不是最优雅的,并且可能无法移植到 soundcloud 之类的地方.

即使是当前的频谱分析也很难破译(图像级别太低):

FL Studio 波形编辑器

我基本上想知道什么对临时用户有用,对于那些提前想知道这首歌将如何播放的人。

2个回答

人类(或他们的耳朵大脑)在声音中感知到的是一种心理声学现象,可能与记录的实际音频完全相关,也可能不完全相关。例如,人类“听到”的确切音符、节拍和乐器可能会受到视觉提示、其他类似音乐的记忆以及相关音符实际声音周围的音乐背景的影响。

我刚刚进入信号处理领域,主要是通过玩 3D 频谱图。这是钢琴中间 C 的 0.3 秒节选。

这是钢琴中间 C 的 0.3 秒节选。面向屏幕的平面显示幅度和频率(频谱图),而面向左侧的平面显示波形(幅度和时间)。我喜欢这种可视化声音的方法,因为它具有两全其美的优点。您可以查看波形的瞬时幅度调制以及频谱中的特定频率信息。我发现有一些程序可以实时为你生成这个。此浏览器内工具可让您使用计算机麦克风从上到下查看 3D 频谱图。它还有一些示例声音可以可视化。

希望这可以帮助!