为了帮助我理解 、 、 的优点和缺点,decision trees
我想构建一个简单的分类器,使用上述 3 种方法将其分类为 2 类(和)。所以我从 kaggle 下载了一个声音数据集,并正在探索pysoundfile作为一个模块来读取声音文件。所以下面的存根:KNN
Neural Networks
Bird Sound
Non-Bird Sound
data, samplerate = sf.read('xc94652.flac')
返回一个 numpy ndarray。的shape
数据因每个文件而异,有些是 of (8637686,)
,有些是(3227894,)
。由于每个文件的长度data
不同,因此每个文件的形状也不同。有什么方法可以使形状data
相等?我打算将数据集的形状设置为所有文件中的最小长度。但它绝对不公平地处理声音文件数据集。我可能会失去这么多的特征,所以最后的模型准确性。