我最近被分配使用 python libROSA库做一些工作。我在音频和音乐分析方面没有丰富的经验,而且 api 和 docs 似乎具有更高的理解水平。例如,hello world 示例说明如下:
- 该示例以 OGG Vorbis 格式编码,
- 变量 sr 包含 y 的采样率,即音频每秒的采样数。
- 默认情况下,所有音频都混合为单声道并在加载时重新采样为 22050 Hz。
我是“为什么需要对音频进行编码?” 和“为什么你甚至需要采样?(我猜是模拟和数字)”和“为什么你需要混合成单声道?” “这甚至意味着什么,'混合'”?
有没有好书或网站可以帮助我对音频和音乐处理有一个基本的了解?
提前致谢