我有一个包含分类特征的数据集,它有 4 个标签和 4 个特征。(它是一个元分类器,所以基分类器的输出作为这个分类器的输入)
Label Feat1 Feat2 Feat3 Feat4
1 1 1 2 2
2 3 1 2 2
3 4 3 3 1
4 4 1 2 4
我正在使用 scikit learn,并且正在考虑使用朴素贝叶斯或决策树。分类器需要能够处理缺失的特征,我在 scikit learn 的页面上读到决策树不支持缺失值。
我正在寻找的是关于如何在使用 scikit learn 时处理缺失的分类值的建议。此外,任何指向解决此问题的学术论文的链接将不胜感激。