从我完全是 DSP 初学者的事实开始,这可能很重要。我有一些录音(采样率为 22 kHz)——鸟歌——我一直在尝试使用 FFT(在 Matlab/Octave 中)进行分析。特别是,我试图使用机器学习分类算法展示这些录音的不同类别具有不同频率(或频率范围)的突出。录音的长度可变,并且由于计算限制,我能做的最大 FFT 大小是 2^19(我理解的是它从每个音频文件中获取的点数)。所以,我的第一个问题是:如果我将我的记录分成几部分,每个部分对应于我选择的 FFT 的大小——将这些部分视为单独的数据示例(即单独的记录)是否仍然合理?
第二个问案子。