如何处理完全连接的前馈网络中的填充输入?

人工智能 深度学习 多层感知器
2021-11-17 15:12:30

我有一个完全连接的网络,它接收一个用 0 填充的可变长度输入。

但是,网络似乎没有在学习,我猜输入中的大量零可能与此有关。

是否有处理全连接层中填充输入的解决方案,或者我应该考虑不同的架构?

更新(提供更多细节)

如果要清理完整的文件路径,网络的目标:ig:

  • /My document/some folder/a file name.txt > a file name
  • /Hard drive/book/deeplearning/1.txt > deeplearning

限制是训练数据标签是使用文件名本身的正则表达式生成的,所以它不是很准确。

我希望通过平等对待每个单词(没有顺序信息),网络能够概括出通常保留哪种类型的单词以及通常丢弃哪种类型的单词。

然后网络接受在路径数据上训练的一系列词嵌入,并输出对应于每个词是否保留的概率的 logits。

1个回答

如果你使用全连接的神经网络,就很难做你想做的事。没有归纳偏差可以轻松地从您需要提取的字符串的不同位置进行概括。

我建议你在这里使用 Seq2Seq 模型:http: //cs224d.stanford.edu/papers/seq2seq.pdf