典型的前馈神经网络需要固定大小的输入和输出。所以当你有可变大小的输入时,用零向量填充输入似乎是一种常见的做法。
为什么拥有“is_padding”属性似乎不是常见的做法?这样网络可以轻松区分填充数据和实际数据?特别是考虑到输入通常以 0 为中心,通过减去均值和使用单位方差。
典型的前馈神经网络需要固定大小的输入和输出。所以当你有可变大小的输入时,用零向量填充输入似乎是一种常见的做法。
为什么拥有“is_padding”属性似乎不是常见的做法?这样网络可以轻松区分填充数据和实际数据?特别是考虑到输入通常以 0 为中心,通过减去均值和使用单位方差。