1.连接word2vec和POS特征
将 POS 信息添加到您的分类器中很好。您当然会想要创建一个训练/开发/测试拆分,例如 5 路交叉验证,以测试添加此信息在多大程度上改善了您的结果(它取决于数据,实际上取决于您的数据,只有您可以测试这个,使用您自己的数据)。
要结合 POS 和 word2vec 功能,您可以简单地将它们连接起来。我假设当您说“CNN”时,您的意思是“一维 CNN”,对吗?因此,如果您只是使用 word2vec 功能,您的输入数据将类似于:
[batch size][sequence length][word2vec dimensions (ie 300)]
即,一个batch size * sequence_length * word2vec_dim
大小的张量。因此,与 POS 特征连接,您的输入数据张量将变为:
[batch size][sequence length][
word2vec dimensions (ie 300) + POS dimensions (ie 20)]
即一个batch size * sequence_length * 320
大小的张量。
2.sense2vec
您可能还想查看来自 Trask et al, 2016, https://arxiv.org/pdf/1511.06388.pdf的 sense2vec,它利用 POS 信息来消除 word2vec 嵌入的歧义:
“本文提出了一种新颖的方法,通过基于监督消歧为每个单词建模多个嵌入来解决这些问题,这为消费型 NLP 模型选择语义消歧嵌入提供了一种快速准确的方法。我们证明这些嵌入可以消除歧义我们进一步评估了词性消歧嵌入在神经依赖解析中的对比意义,例如名义和口头意义以及细微差别的意义,在 6 种语言中,未标记附件分数的平均错误减少了 8% 以上。 "