如何以最好的方式组合两个不同的嵌入?

数据挖掘 机器学习 神经网络 深度学习 分类 张量流
2022-02-19 14:53:47

我有两个模型可以嵌入两本书

Ml_model_a => book1_embedding [ 1, 200 ]

Ml_model_b => book2_embedding [ 1, 200 ]

我正在构建第三个模型,它将采用这两种不同的嵌入来告诉我该选择哪本书。

现在我的最后一层是 0,1 之间的分类(选择哪本书)。如何以最好的方式学习这些嵌入以更好地分类?

我已经尝试过的:

在此处输入图像描述

如果我对这些嵌入进行平均然后发送到一个模型,那么嵌入会丢失很多信息,所以我使用连接方法。

但是分类不好,有没有其他模型,一种我可以用来增强学习书籍嵌入和预测要拿哪本书的能力的技术?

3个回答

我想说,这里最好的做法是连接两个嵌入,并使用连接的向量作为二进制分类模型的输入,而不使用规范 -> 你会丢失太多信息,即:

final_layer = concatenate [ book_1_attention, book_2_attention]

我认为没有规范的连接会增加维度(但这可能是您有解决方案的问题 - 例如正则化)

您可以查看有关学习排名的文献,例如这项工作,它确保了自反性,是反对称和传递的。

如果您将 l2 范数应用于您丢失大量信息的向量,我认为最好的做法是评估这些选项:

  • 将嵌入与/在其之上的线性层连接起来
  • 将嵌入与/在其之上的线性层相加