你们是否尝试过将 TF-IDF 特征*与浅层神经网络分类器的性能与深度神经网络模型(如 RNN)进行比较,该模型具有嵌入层,词嵌入作为输入层旁边的权重?我在几个推文数据集上进行了尝试,得到了令人惊讶的结果:TF-IDF 的 f1 得分约为 65%,而 RNN 的 f1 得分约为 45%。我尝试了设置嵌入层 + 浅层全连接层与 TF-IDF + 全连接层,但结果几乎相同。你们能否就 TF-IDF 特征如何优于深度 NN 的嵌入层发表一些意见?这种情况常见吗?谢谢!
- 我使用 unigrams 和 bigrams 来生成 TF-IDF 特征