我正在尝试训练文本分类模型。对于所有句子示例,我将它们限制为最多 32 个单词,如果不存在 32 个单词,我将创建零填充数组。为了将每个单词转换为向量,我使用了预训练的 word2vec 模型。
在最终设置中,我的数据的形状是:
x_train: 15000 个样本,每个样本有 32 个向量,每个向量大小为 100 (15000, 32, 100)。
y_train: 15000 个二进制目标(15000, 1)
所以我的问题是,我应该在我的 x_train 或 2D CNN 上应用 1D CNN 吗?我认为我可以通过两种方式做到这一点,但是对于这类问题有没有主要的正确方法?我读了一些关于文本分类的 1D CNN 的东西,但也有一些 2D CNN 的例子。有什么缺点和优点?

