我有一个包含 365 条记录的数据集,我想在其上应用分类模型(二进制分类)。
作为输出,除了分类标签之外,我还想检索每个实例的分类置信度。
我不知道如何处理这种情况。例如,我可以对这个小数据集使用线性分类器(SVM、逻辑回归)吗?因为,我也想检索分类置信度。
我读到决策树可以成为小型数据集的一个很好的分类器,但是我怎样才能用它来检索分类置信度呢?
数据集由推文组成,每条推文都分为正面或负面(从情绪的角度来看),我的特征向量由 2400 个特征(word2vec 嵌入和其他特征的组合)组成。
另外,你推荐我在这么小的数据集上使用 word2vec 嵌入吗?我认为分类器无法使用小数据集从他们身上学到一些东西。