我正在探索不同类型的解析树结构。两种广为人知的解析树结构是 a) 基于选区的解析树和 b) 基于依赖关系的解析树结构。
我可以使用斯坦福 NLP 包生成两种类型的解析树结构。但是,我不确定如何将这些树结构用于我的分类任务。
例如,如果我想进行情感分析并将文本分类为正面和负面类别,我可以从解析树结构中获得哪些特征来完成分类任务?
我正在探索不同类型的解析树结构。两种广为人知的解析树结构是 a) 基于选区的解析树和 b) 基于依赖关系的解析树结构。
我可以使用斯坦福 NLP 包生成两种类型的解析树结构。但是,我不确定如何将这些树结构用于我的分类任务。
例如,如果我想进行情感分析并将文本分类为正面和负面类别,我可以从解析树结构中获得哪些特征来完成分类任务?
通过使用解析树,您可以将句子分成几部分。假设,在情感分析的例子中,您可以使用这些部分为每个部分分配正面/负面情绪,然后获取这些部分的累积效果。
此图将帮助您了解更多。前半部分有负面情绪(主要是因为“干”这个词),但是因为“但是”这个词和“享受”这个词的使用,负面情绪变成了积极情绪。
至于使用它们,您可以简单地生成句子中各个单词的词向量表示,并使用神经元代替父节点。每个神经元应该通过权重连接到另一个神经元。所有的叶子节点都将是句子中单词的词向量表示。顶部的父神经元(在这种情况下是顶部的蓝色 + 符号)应该根据句子产生积极/消极的情绪。这种树结构可以以监督的方式进行训练。
阅读本文以获得更多的理解。
图片来源:cs224.stanford.edu
我认为依赖关系可用于提高情绪分类器的准确性。考虑以下示例:
E1:比尔不是科学家
并假设令牌“科学家”在特定领域具有积极情绪。
知道依赖 neg(scientist, not) 我们可以看到上面的例子有负面情绪。在不知道这种依赖关系的情况下,我们可能会将句子归类为肯定的。
可能以相同的方式使用其他类型的依赖关系来提高分类器的准确性。