在文本分类中,如果我获得 100 个特征和 200 个特征的相似性能,我应该继续使用哪个模型?

数据挖掘 机器学习 nlp 特征选择 机器学习模型 文本分类
2022-03-11 15:20:57

我已经建立了两个文本分类器模型,一个有 200 个特征,另一个有 100 个特征(特征选择后从 200 个减少到 100 个)。我在两者中都看到了类似的表现。我应该使用哪种型号进行生产?

1个回答

您应该使用更简单的模型,即需要较少功能的模型。更少的特征意味着更快的训练周期、更好的可解释性和更快的前传。如果您想生产模型,所有这些都是重要的考虑因素。