嵌入可变长度“多热编码”功能

数据挖掘 喀拉斯 嵌入
2022-03-04 00:41:27

如何在 Keras 中实现一个嵌入层,该嵌入层接受可能具有可变长度的输入?例如,如果词汇表是 10 长,我可以输入如下:

[1]
[2,4,5]
[7,3]

但是 Keras 嵌入不接受可变长度输入。我想我可以零填充,这样它看起来像:

[1,0,0]
[2,4,5]
[7,3,0]

但这会使一些输入变得很长(在我的特殊情况下,在大约 10000 的词汇中最长可达 500 个向量)。如果只有一个数据示例的长度为 500,它甚至会强制将长度为 1 的数据示例补零到 500。

有没有更好的方法来处理可变长度输入?

0个回答
没有发现任何回复~