我有各种长度的文本数据,参差不齐的张量似乎很适合。例如,我的数据可能如下所示:
x = tf.ragged.constant([[1,2,3,4,5,6,7], [5,6,1,2]])
我想将这个参差不齐的张量提供给由一些卷积滤波器组成的模型,假设至少一个滤波器如下:
model = Sequential([Embedding(alphabet_size, embedding_dim),
Conv1D(filters=10, kernel_size=10),
GlobalMaxPooling1D()])
我尝试使用,tf.ragged.map_flat_values但是我不确定它是否符合我的要求,即:嵌入批处理的每个文本行,对其进行卷积,然后在每个文本行上取最大值。
有没有一种解决方法可以让这个模型在(非常)可变长度的文本上工作(当然除了使用 3d 张量批次)?