时间序列的特征工程(音频信号)

数据挖掘 美国有线电视新闻网 特征工程 音频识别
2022-02-14 19:20:07

我的任务是使用任何合适的算法对音频信号进行分类。经过一些研究,我发现,本文中的 CNN显示出有希望的结果。但是,它仍然需要改进。当前数据沿每个样本缩放(即每个音频信号的均值为零且方差相同(即 1)),这会导致有关信号幅度和方差的信息丢失。有没有办法将此信息(即,如果我在缩放之前单独计算)附加到当前信号以使 CNN 使用它?

提前感谢您的帮助!

1个回答

截至 2019 年,最常见的方法是将原始音频波形转换为时频表示(“频谱图”)。一般音频最常用的频谱图是对数缩放的梅尔频谱图。这允许使用 2D CNN,与用于图像的非常相似。