我有类似于下面的文本,我想找到这些文本和意图之间的语义相似性。
1)辞职的不同步骤是什么?
1) 辞职程序?
1)我必须遵循哪些流程才能辞职?
1)任何公司辞职的常见方案是什么!
2) 我辞职后需要联系谁?
3) 我今天确实辞职了。
4)如果你再犯错,我就辞职!!
4) 你的粗鲁行为让我辞职了。
5) 不同的公司有不同的离职政策!!
为了解决上述问题,我发现“处理重复问题的 Quoras 模型”很有趣。所以我想让我们试试这个,但有一些小的变化。而改变是做二分类,让我们做多类分类。所以我试图对“Quora 数据集”进行多类分类。我的意图是使用 LSTM、CNN 模型将每个问题及其重复问题分类到向量空间上的一个类中。如果序列保持不变,LSTM 工作。但正如您所知,问题结构可以改变保持意图相同(或者我们可以将它们称为重复问题。)。所以为了处理这样的问题,我尝试使用 CNN。CNN 适用于一些小数据集,但对于大数据集,它变得非常敏感或重叠。
所以我在想“我可以利用 NLP 和深度学习来寻找意图和语义关系吗?”
我有 POS 标签、NER、SRL、LST、实体类型、关系类型等功能。我如何在深度学习中利用 NLP 的这些特性来获得最先进的结果?
有一篇论文“何时需要树结构来进行深度学习表示? ”,它使用解析树作为递归神经网络模型的输入。有没有类似的作品?谁能给我本文中使用的数据集?