我应该如何处理神经网络的可变长度输入?

人工智能 神经网络 机器学习 数据预处理
2021-11-12 06:27:54

我是人工智能领域的初学者。我基本上是一名没有太多编码经验的制药专业人士。我为神经网络使用基于 GUI 的工具。

我正在尝试开发一种人工神经网络,它接收蛋白质序列作为输入并产生药物分子作为输出。药物分子可以表示为固定长度的二进制 (0-1)。该长度为 881 位。

但是,我不知道如何将可变长度的蛋白质序列转换为固定长度的二进制表示。

那么,我应该如何处理神经网络的可变长度输入?什么是最好的方法?

1个回答

人们处理不同长度输入的最常见方式是填充

您首先定义所需的序列长度,即您希望模型具有的输入长度。然后用零或特殊字符填充任何长度比这更短的序列,以便它们达到所需的长度。如果输入大于您想要的长度,通常您会将其拆分为多个输入。