我有一个具有以下规范的二进制分类任务:
输入:文本块(不超过几个句子,主要是一个句子)。
附加输入:对于每个输入样本,都有可用的附加信息(这也是一些长度相似的文本,最多 2-3 个句子)。
问题:使用附加上下文对文本内容进行分类
问题类型:二进制分类
本质上,任务归结为根据上下文或p(content|context) 对内容进行分类。
我正在考虑使用深度神经网络对文本进行编码以进行分类的有效方法。我搜索了最近的作品,但现有的文献大多使用下面提到的技术。
我想知道是否有更好的方法来编码上下文?与仅串联相比,这在某些领域已证明是有效的。
编码然后连接:这涉及使用类似于内容的方式对上下文进行编码,然后在分类之前连接特征表示。这是广泛使用的技术。这种技术有很多变体(编码文本的不同方法,例如使用 tfidf rep、词嵌入、LSTM、CNN),这些变体得到了广泛的探索。
有没有更好的方法在分类过程中带来上下文信息?
PS:递归 RNN 是我的 TODO 中的东西。