我想在文档上应用 CNN。我有 tf-idf 文档向量(每个文档一个向量)。
我的问题是,1D CNN 是否适用于这种情况?我问这个问题的原因是我已经阅读了应用于向量序列的一维卷积,并且在这种情况下我将标量序列(tf-idf 向量)作为输入,那么它适用吗?
我想在文档上应用 CNN。我有 tf-idf 文档向量(每个文档一个向量)。
我的问题是,1D CNN 是否适用于这种情况?我问这个问题的原因是我已经阅读了应用于向量序列的一维卷积,并且在这种情况下我将标量序列(tf-idf 向量)作为输入,那么它适用吗?
在 TFIDF 表示中,“邻居”是不可解释的。文档向量中的第 1 个数字与第 2 个和第 100 个的关系一样多。而在标准时间序列或序列分析的情况下,“邻域”是可以解释的。另一方面,如果您可以以某种方式对 TFIDF 表示进行重新排序,这从分析的角度来看是有意义的(例如:基于单词的“情绪”进行排序),也许 1D CNN 会显示出一些好的结果。