所以,我有一个大约 60 x 1000 的矩阵。我将其视为具有 1000 个特征的 60 个对象;60 个对象分为 3 个类(a、b、c)。每个类有 20 个对象,我们知道真正的分类。我想对这组 60 个训练示例进行监督学习,我对分类器准确性(和相关指标)以及 1000 个特征的特征选择都很感兴趣。
首先,我的命名如何?
现在真正的问题:
如前所述,我可以在其上扔随机森林,或任何数量的其他分类器。但是有一个微妙之处——我真的只关心区分 c 类和 a 类和 b 类。我可以合并 a 和 b 类,但是有没有一种很好的方法来使用所有非 c 对象可能形成两个不同的集群的先验知识?我更喜欢使用随机森林或其变体,因为它已被证明对类似于我的数据有效。但我可能会被说服尝试其他一些方法。