我在比赛开始前获得了基于比赛(足球)的推文。我有一些推文指定一支球队将以 3-1 获胜,等等,这些推文很容易使用正则表达式进行分析。我在推文中遇到了困难,其中两个团队名称指定了赢/输比较,例如:
曼联将在今晚对阵热刺的比赛中获胜。(或)热刺会发现很难打破曼联的防守。
我已经获取了几条这样的推文,并将团队名称替换为 TEAMONE 和 TEAMTWO,并将它们放入两个文件中(teamone 获胜推文和团队 2 获胜推文)。使用 SVM,该模型无法在两个类(上面提到的文件)之间清楚地分类推文。是因为阶级不平衡吗?在这种情况下,我应该坚持基于规则的分类还是任何不同的方法有效?我是 ML 的新手,任何建议都将不胜感激。