首先,我不确定模型在训练期间是否包含编码器。
EOS 表示句子结束。编码器和解码器是变压器网络的一部分。
如果没有编码器,训练时间:
target: [E, F, G, H, EOS]
decoder input: [0, E, F, G, H]
如果没有编码器,测试时间:
decoder input: [0]
如果使用编码器,训练时间:
encoder input: [A, B, C, B]
target: [E, F, G, H, EOS]
decoder input: [0, E, F, G, H]
如果使用编码器,测试时间:
encoder input: [A, B, C, D]
decoder input: [0]
我说的对吗?