我希望能够设计一个分类器,可以区分不同类型的对话(不一定能说明情绪、诚意或结果,这有点牵强)。
例如,要知道在 50 个对话样本中,10 个涉及双方都在寻找有关未来事件的信息,30 个似乎没有目标,10 个涉及一方从另一方寻求有关过去事件的信息(实际上,算法会分类不考虑实际情况,分为Ⅰ、Ⅱ、Ⅲ类)。
换句话说,演讲者的顺序与内容一起很重要,也许通过在算法中植入某些关键字来帮助。
是否有一个分类系统可以以相当高的精度执行这项任务?
我希望能够设计一个分类器,可以区分不同类型的对话(不一定能说明情绪、诚意或结果,这有点牵强)。
例如,要知道在 50 个对话样本中,10 个涉及双方都在寻找有关未来事件的信息,30 个似乎没有目标,10 个涉及一方从另一方寻求有关过去事件的信息(实际上,算法会分类不考虑实际情况,分为Ⅰ、Ⅱ、Ⅲ类)。
换句话说,演讲者的顺序与内容一起很重要,也许通过在算法中植入某些关键字来帮助。
是否有一个分类系统可以以相当高的精度执行这项任务?
这就是我将如何处理它。您实际上需要检查文本是否属于 I 类或 III 类(否则它将是 II 类)。
如果你有一个足够大的学习数据集,你可以很容易地找出这两个词袋是什么,以及它们的两个阈值。