我正在研究音频流项目推荐系统的基于内容的过滤部分。
我首先使用带有音乐流派和 one-hot 编码的 k-mean 算法将音乐分类为不同的组。但是,为了获得更精确的结果,我想更改它并使用音频功能来代替模型。
所以我的问题是:
- 我的方法是否正确。
- 我可以从音频文件中提取的最相关的音频特征是什么。
谢谢你的回答。
编辑:
现在,我正在提取这些特征:
- 音乐节奏
- 过零率
- 期间
- 光谱质心
- 光谱滚降
- MFCC
- 光谱带宽
- 光谱对比
我想知道这些音频特征在何种程度上与“描述”音频提取相关。