原始问题:https ://ux.stackexchange.com/q/23040/16006
我只参加了一些基本的信号分析课程,所以我可能会遗漏一些东西。
纯理论问题:
有哪些表示音频的方法?
可以使用哪些方法来表示音频,更具体地说是音乐音频?
到目前为止,我知道:
查看波形(Soundcloud 这样做),除了看到“响度”之外,几乎没有用处
频谱分析(示例),有利于查看频率和“响度”
本质上,我想知道是否有一种方法可以直观地“看到”一首歌的音符、节拍等。
就在我的脑海中,我可以想到随着时间的推移显示 3 个不同颜色的波,代表高音、中音、低音在类似声音云的容器中,播放(或鼠标悬停)的部分被放大,周围的波形被压缩成角落(如广角镜头效果)。
编辑:我不知道可以在哪里使用,这只是出于我对当前音频可视化技术的挫败感。
我想随着时间的推移进行频谱分析的 3d 图(忍者编辑:显然称为频谱图)将是“最佳”解决方案,因为您可以看到所有内容,但它可能不是最优雅的,并且可能无法移植到 soundcloud 之类的地方.
即使是当前的频谱分析也很难破译(图像级别太低):
我基本上想知道什么对临时用户有用,对于那些提前想知道这首歌将如何播放的人。