信息处理 - 以视觉方式表示音频的最佳方式是什么？（来自 UX 的 x-post） - 吾爱随笔录

我只参加了一些基本的信号分析课程，所以我可能会遗漏一些东西。

纯理论问题：

有哪些表示音频的方法？

可以使用哪些方法来表示音频，更具体地说是音乐音频？

到目前为止，我知道：

本质上，我想知道是否有一种方法可以直观地“看到”一首歌的音符、节拍等。

就在我的脑海中，我可以想到随着时间的推移显示 3 个不同颜色的波，代表高音、中音、低音在类似声音云的容器中，播放（或鼠标悬停）的部分被放大，周围的波形被压缩成角落（如广角镜头效果）。

编辑：我不知道可以在哪里使用，这只是出于我对当前音频可视化技术的挫败感。

我想随着时间的推移进行频谱分析的 3d 图（忍者编辑：显然称为频谱图）将是“最佳”解决方案，因为您可以看到所有内容，但它可能不是最优雅的，并且可能无法移植到 soundcloud 之类的地方.

即使是当前的频谱分析也很难破译（图像级别太低）：

我基本上想知道什么对临时用户有用，对于那些提前想知道这首歌将如何播放的人。