数据挖掘 - 数据分类 - 吾爱随笔录

我正在使用 Google API 对笔记本电脑的问题（硬件、软件、网络、客户满意度、无理由）进行分类和预测。我插入了我的训练数据，并且类别得到了很好的评估和预测。训练数据仅使用 5 个主要类别，因为它来自自由文本并且具体需要一些手动工作。现在我想更深入地标记这些类别：示例。笔记本电脑因显示器被破解而被退回：硬件类别已定义，但我有一本字典，我也可以在其中查找“显示器”一词。例子：

Hardware:
   Display:
      failure: True
   Info:
      Physical_damage: Display cracked

无法安装 Skype：

Software:
   Applications:
      Skype:
       failure: True
   Info:
      Description: Unable to upgrade

我想首先使用主要类别进行分类，然后在选择主要类别后，查看我的文本以从一组单词中寻找可能的选项（例如：{"display": ["screen", "display", "monitor"] }, {"applications", "skype","office","adobe","spotify"}

我应该分两个阶段运行这些吗？有什么推荐的模式或解决方案吗？