所以我的任务是根据他们显示的“改变谈话”的水平对句子进行分类。改变谈话是心理咨询中使用的一个术语,用于表达客户想要改变他们的行为的程度。
所以假设有两个类:change talk;和不变的谈话。
改变谈话的一个例子是:“我必须这样做。” 或“我能做到”。
不改变谈话的一个例子是“我不能这样做”。或“我没有动力”。
我的问题是,如果我想采用机器学习方法对这些句子进行分类,哪种方法最好?支持向量机?我没有很多训练数据。另外 - 我看到的所有教程都使用带有明显单词的句子,很容易分类(例如“棒球比赛明天开始。”-> 体育,或“唐纳德特朗普明天将在电视上发布公告。”-> 政治)。
我觉得我的数据更难分类,因为它通常没有与每个类别相关的关键字。
关于人们如何处理这项任务的一些指导会很棒。