我目前的调查表明sklearn.preprocessing.StandardScaler(),神经网络的某些类型的特征提取并不总是正确的选择。
假设我想根据频谱图数据对声音事件进行分类。第二个这样的数据可能如下所示:

在这里可以看到一秒钟内大约 1kHz 的正弦波。低频段的解决是特定于特征提取的,而不是问题的一部分。数据是(n,28,40)dBFS 值的矩阵,因此是相对于 wav 文件的最大数字余量的对数能量水平。
如果StandardScaler现在应用,声音的视觉表示现在看起来像这样:

...这基本上消除了定义特征并放大了噪音,这正是不想要的。基于电平的定标器在这里是更好的选择,还是StandardScaler()在正弦波的这种特定情况下似乎没有使系统受益?
注意:我是一名学生,我没有多年的经验。因此,如果问题缺乏质量,我要求您在否决之前提出改进建议。谢谢你。