使用一维 tf-idf 特征向量在文本文档上应用卷积神经网络

数据挖掘 深度学习 神经网络 文本挖掘 卷积神经网络
2022-02-12 18:46:44

我想在文档上应用 CNN。我有 tf-idf 文档向量(每个文档一个向量)。

我的问题是,1D CNN 是否适用于这种情况?我问这个问题的原因是我已经阅读了应用于向量序列的一维卷积,并且在这种情况下我将标量序列(tf-idf 向量)作为输入,那么它适用吗?

1个回答

在 TFIDF 表示中,“邻居”是不可解释的。文档向量中的第 1 个数字与第 2 个和第 100 个的关系一样多。而在标准时间序列或序列分析的情况下,“邻域”是可以解释的。另一方面,如果您可以以某种方式对 TFIDF 表示进行重新排序,这从分析的角度来看是有意义的(例如:基于单词的“情绪”进行排序),也许 1D CNN 会显示出一些好的结果。