CRNN 是否对其标签使用稀疏张量值?

数据挖掘 深度学习 美国有线电视新闻网 rnn ocr
2022-02-13 01:24:46

我刚刚阅读有关用于文本识别的 cnn + rnn 的论文。数据集的标签是字符索引的张量(例如 [0, 1, 2 ] 用于标签为“abc”的图像)。由于每个输入的标签长度​​不同,我需要将标签转换为稀疏张量值吗?因为论文没有提到它。

1个回答

我的假设是,如果输入向量的长度可变,则应使用 keras.preprocessing.sequence.pad_sequences 之类的东西(以及忽略这些填充值的掩码层)作为将所有输入样本重新格式化为相同的方法大小,以便循环模型的输入满足具有固定 num_timesteps 长度的要求。
功能文档

将序列填充到相同的长度。

此函数将 num_samples 序列列表(整数列表)转换为 2D Numpy 形状数组(num_samples,num_timesteps)。num_timesteps 是 maxlen 参数(如果提供),否则是最长序列的长度。

短于 num_timesteps 的序列在最后用值填充。

长于 num_timesteps 的序列将被截断,以使其符合所需的长度。发生填充或截断的位置分别由参数填充和截断决定。