使用声谱图进行深度学习以进行声音识别
数据挖掘
深度学习
多标签分类
音频识别
2021-09-21 04:30:46
2个回答
RNN 没有产生足够好的结果,而且也很难训练,所以我选择了 CNN。
因为特定的动物声音只有几秒钟长,我们可以将频谱图分成块。我使用了 3 秒的长度。然后,我们对每个块执行分类并对输出进行平均,从而为每个音频文件创建一个预测。这非常有效,而且实现起来也很简单。
更深入的解释可以在这里找到: http ://ceur-ws.org/Vol-1609/16090547.pdf
其它你可能感兴趣的问题