有没有办法修改 word2vec 或 BERT 以扩展查找不在训练数据中的单词的嵌入?我的数据是非常特定于领域的,我真的不希望预训练的模型能很好地工作。我也无法访问大量此类数据,因此无法自己训练 word2vec。我在想类似 word2vec 和 PMI 矩阵的组合(即 2 个向量表示的串联)。请问这行得通吗,有人有其他建议吗?
提前致谢!
有没有办法修改 word2vec 或 BERT 以扩展查找不在训练数据中的单词的嵌入?我的数据是非常特定于领域的,我真的不希望预训练的模型能很好地工作。我也无法访问大量此类数据,因此无法自己训练 word2vec。我在想类似 word2vec 和 PMI 矩阵的组合(即 2 个向量表示的串联)。请问这行得通吗,有人有其他建议吗?
提前致谢!