假设我有一个序列和相应的标签.
一个例子是一个人进行网站访问和标签告诉我们之前的访问中是否有购买。
将多个序列训练为一个序列或将单个序列训练为序列之间有区别吗?
多序列合一
这种方法给了我们数据点。此外,模型似乎会看到n次,而只会喂一次。
...
单序列到序列
这种方法只给了我们 1 个数据点。
,数据中没有重复。
这些在 RNN(例如 LSTM)训练中产生相同的结果吗?似乎当您的数据不平衡时,您将从第一种方法中受益匪浅,因为您可以获得更多观察结果。
我的理解是,由于在我的情况下,即使是单个数据点在技术上也是有效的数据点,我应该使用多序列到一种方法。但是在 NLP 的情况下(其中第一个单词没有上下文),显然我们需要整个序列。