数据分类

数据挖掘 机器学习 分类 nlp 多标签分类 nltk
2022-02-20 10:50:34

我正在使用 Google API 对笔记本电脑的问题(硬件、软件、网络、客户满意度、无理由)进行分类和预测。我插入了我的训练数据,并且类别得到了很好的评估和预测。训练数据仅使用 5 个主要类别,因为它来自自由文本并且具体需要一些手动工作。现在我想更深入地标记这些类别:示例。笔记本电脑因显示器被破解而被退回:硬件类别已定义,但我有一本字典,我也可以在其中查找“显示器”一词。例子:

Hardware:
   Display:
      failure: True
   Info:
      Physical_damage: Display cracked

无法安装 Skype:

Software:
   Applications:
      Skype:
       failure: True
   Info:
      Description: Unable to upgrade    

我想首先使用主要类别进行分类,然后在选择主要类别后,查看我的文本以从一组单词中寻找可能的选项(例如:{"display": ["screen", "display", "monitor"] }, {"applications", "skype","office","adobe","spotify"}

我应该分两个阶段运行这些吗?有什么推荐的模式或解决方案吗?

0个回答
没有发现任何回复~