我正在尝试对形态丰富的语言(俄语)的内部单词结构进行一些实验。
每个有效字符都经过 1-hot 编码,然后将固定长度的向量连接起来生成词向量:
c a t
(0... 1... 0) (0... 1... 0) (0... 1... 0)
这种方法为不同长度的单词生成不同长度的向量。为了统一它们,我应用了零填充:
c a t 0 0 0 0 0 0 0 0
k i t t e n 0 0 0 0 0
t r a n q u i l i t y
h a p p i n e s s 0 0
这种方法听起来有效吗?所描述问题的最佳实践是什么?