我使用频谱图作为我用 Python 中的 tensorflow.keras 创建的卷积神经网络的输入。
它的形状是(时间,频率,1)。
CNN 的输入形状是 (None, time, frequency, n_channels),其中 n_channels=1,第一层是 Conv2D。在每个卷积层之间,我在激活层之前使用 BatchNormalization 层。BatchNormalization 的默认值为“axis=-1”。我应该保持原样还是应该使用对应于“频率”轴的“axis = 2”来制作它?
这背后的想法是频谱图的特征在频率轴上表示。