我正在使用 ESC-50 数据集构建二进制声音分类器。我选了一门“狗吠”为阳性,其余 49 门课程为阴性。由于数据集不平衡,我遇到了很多培训问题。我尝试构建模型,但无法获得大于 0.3 的 f1 分数。
我正在使用 mfcc 和 fft 作为功能。我曾尝试使用 LR 和 SVM 进行训练,但没有取得多大成功。不能使用深度学习模型,因为它是一个实时系统并且不会有太多延迟。
我该如何解决这个问题?
我正在使用 ESC-50 数据集构建二进制声音分类器。我选了一门“狗吠”为阳性,其余 49 门课程为阴性。由于数据集不平衡,我遇到了很多培训问题。我尝试构建模型,但无法获得大于 0.3 的 f1 分数。
我正在使用 mfcc 和 fft 作为功能。我曾尝试使用 LR 和 SVM 进行训练,但没有取得多大成功。不能使用深度学习模型,因为它是一个实时系统并且不会有太多延迟。
我该如何解决这个问题?