当有人想要比较 2 个输入时,最普遍的想法是使用连体架构。连体架构是一个非常高级的想法,可以根据我们需要解决的问题进行定制。
是否有任何其他架构类型可以比较 2 个输入?
背景
我想使用神经网络来比较 2 个文档(语义文本相似性)。连体网络是一种方法,我想知道是否还有更多。
当有人想要比较 2 个输入时,最普遍的想法是使用连体架构。连体架构是一个非常高级的想法,可以根据我们需要解决的问题进行定制。
是否有任何其他架构类型可以比较 2 个输入?
我想使用神经网络来比较 2 个文档(语义文本相似性)。连体网络是一种方法,我想知道是否还有更多。
可以训练 RBM(受限玻尔兹曼机)来提取文档特征。同一台机器可以提取两个或多个文档的特征。因为使用相同的机器参数和 CPU(保存特征结果)可以轻松地串行处理文档,就像使用单独的 CPU 可以并行处理文档一样,Siamese 思想不是系统架构的特征,而是更多的特征的过程拓扑。如何在可用硬件上运行进程拓扑的架构决策通常应该保持一定程度的解耦。
比较操作可以是经过训练的 MLP(多层感知器),以根据必要数量的示例文档比较产生比较结果。在这种情况下,应该使用先前训练的 RBM 作为前端来训练 MLP。您将需要一些人工来生成或从可用数据源中提取示例文档比较结果。将需要示例结果以及与比较对应的一对 RBM 特征提取结果的参考来训练 MLP。
甚至在 RBM 的更上游,生成可靠和准确的文档处理以对文档进行预处理通常很有用。可以描绘图像和文本,以便可以以一种方式从图像中提取特征,以另一种方式从文本中提取特征,然后以第三种方式从文本和图像序列中提取特征。在此类过程拓扑中,CNN(卷积网络)通常对图像进行预处理,而 LSTM 网络通常对文本进行预处理。然后它们可以直接进料 RBM 或通过另一个过程组件间接进料。