我正在做一个项目,我想对 Tabla taalas(patterns) 进行分类,但我没有找到任何关于它的数据集。我自己记录它们,我记录了大约 500 个数据样本。如果我有少于 500 个样本和 6 个类,我应该使用什么模型对模式进行分类?
哪种模型用于多类音频分类?
数据挖掘
机器学习
深度学习
多类分类
2022-02-16 00:02:52
1个回答
6 个班级的 500 个样本并没有那么多。您应该留出大约 100 个样本用于验证和 100 个用于测试,留下 300 个样本用于训练。我假设这些鼓循环大约为 1 秒长(0.5-5 秒)。然后我会建议尝试一个预训练的音频模型,它通常有 1 秒的分析窗口。例如OpenL3,它是一种功能强大且易于使用的音频嵌入。它甚至有经过音频训练的预训练版本。在音频嵌入之上尝试一个简单的线性分类器,如 LogisticRegression 或 RandomForest。