除了明显的分类器特征,如
- 计算成本,
- 特征/标签的预期数据类型和
- 适用于某些大小和维度的数据集,
在新数据集上首先尝试的前 5 个(或 10、20 个?)分类器是什么?通常我会尝试朴素贝叶斯、最近邻、决策树和支持向量机——尽管我没有充分的理由选择这种方法,除了我了解它们并且大多了解它们是如何工作的。
我想应该选择涵盖最重要的一般分类方法的分类器。根据该标准或任何其他原因,您会推荐哪种选择?
更新:这个问题的另一种表述可能是:“存在哪些一般的分类方法,哪些具体方法涵盖最重要/流行/有希望的方法?”